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Quern mensura o paraiso, a terra, o mar e o ceu 
De modo a buscar folclore ou excita^do 
Deixe-o avisado de um idiota ser. 

Sebastian Brant, Ship of Fools, 1494. Basel, Sui$a 


[NJumeros sdo palavras sem as quais a exata descrifao de qualquer fendmeno natural e 
impossivel .... Seguramente, qualquer fendmeno objetivo, de qualquer tipo, e quantitative, 
bem como qualitativo; ignorar o primeiro , ou deixa-lo de lado como desimportante, 
virtualmente substitui a natureza objetiva por brinquedos abstratos, totalmente desprovidos 
de dimensoes - brinquedos que nem existem nem podem ser concebidos a existir. 

E. L. Michael, “Marine ecology and the coefficient of association: 

A plea in behalf of quantitative biology”, 1920. 

Journal of ecology 8: 54-59. 


[N]os agora sabemos que aquilo que chamamos de leis da natureza sdo meramente 
verdades estatxsticas e, desta forma, devem necessariamente permitir excefdes.... [N] 
os precisamos do laboratorio com suas restriqoes incisivas com objetivo de demonstrar a 
validade invariavel da lei da natureza. Se deixarmos as coisas para a natureza, veremos 
uma cena bastante diferente: qualquer processo eparcial ou totalmente interferido pelo 
acaso, tanto assim que, sob circunstdncias naturais, o curso dos eventos, absolutamente em 
conformidade com leis espedficas, e quase uma excegao. 

Carl Jung, Foreword to The I Ching or Book of Changes. 

Third Edition, 1950, traduzida por R. Wilhelm e C. F. Baynes. 

Bollingen Series XIX, Princeton University Press. 
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Apresentafao a 
Edigao Brasileira 


U m dos aspectos mais importantes da revolu^ao cientifica nos seculos XVII e XVIII foi 
a ado^ao de um pensamento quantitativo (matematico) na ciencia. Isso permitiu o 
desenvolvimento de modelos quantitativos capazes de fazer predi^oes sobre os fenomenos na¬ 
tural, alem da confronta^ao dessas predi^oes com dados empiricos. Esta ultima etapa passou 
a ser particularmente importante a partir do desenvolvimento da estatistica, ja no seculo XX. 
Nessa epoca, as diferentes areas da biologia, considerando sua grande heterogeneidade, segui- 
ram caminhos divergentes. Algumas areas adotaram rapidamente uma visao experimental e 
quantitativa, seguindo a tradi^ao mecanicista da fisica e da quimica, enquanto outras continu- 
aram com uma visao mais descritiva e naturalistica, ainda muito associada a um pensamento 
metafisico e vitalista, sobretudo pela falta de uma grande teoria unificadora que permitisse 
compreender a complexidade dos sistemas vivos. 

Seria de se esperar, portanto, que essa dicotomia desaparecesse depois do estabelecimen- 
to do darwinismo e da teoria sintetica da evolu^ao, entre os anos 30 e 40 do seculo XX. De 
fato, a consolida<;ao do pensamento evolutivo se desenvolveu principalmente a partir dos 
trabalhos em genetica populacional e genetica evolutiva de Ronald A. Fisher, J. B. S. Haldane 
e Sewall Wright, com um fortissimo arcabou^o matematico e estatistico. A ecologia, por sua 
vez, sendo uma area relativamente nova da biologia, emergiu ja no seculo XX em um contex- 
to mais quantitativo desde o seu inicio, com uma visao fortemente quantitativa e experimen¬ 
tal, partindo primeiro de modelos demograficos e ecossistemicos e, logo apos, associando 
processos evolutivos e populacionais no contexto da ecologia “evolutiva”, desenvolvida sobre¬ 
tudo por E. Hutchinson, R. MacArthur, E. O. Wilson, dentre tantos outros. 

Entretanto, as mudan<;as nao ocorreram como esperado, e uma tradi^ao puramente des¬ 
critiva e naturalistica ainda permanece forte dentro de varias areas da biologia (incluindo 
alguns campos da ecologia). Em pleno seculo XXI, deveria estar claro que uma visao quanti¬ 
tativa de mundo e absolutamente imperativa para o desenvolvimento da ciencia moderna, e 
que a falta dessa visao traz serias consequencias para a forma^ao dos biologos como cientistas, 
reduzindo sua capacidade de atuar de forma plena na resolu^ao de questoes importantes (e 
de fato emergenciais) da atualidade. O que ocorre, nesse contexto, e que muitos dos alunos 
de gradua^ao em Ciencias Biologicas iniciam o curso com barreiras de aprendizado, erigi- 
das ainda em etapas anteriores da educa^ao formal. E, durante a gradua^ao, essas barreiras 
tendem a se intensificar, as disciplinas quantitativas passam a ser consideradas, infelizmente, 
dificeis, sem importancia para a biologia e de pouca utilidade pratica. Alem disso, e importan¬ 
te destacar que, em muitos casos, os professores responsaveis por algumas dessas disciplinas, 
infelizmente, contribuem para a forma^ao dessa barreira. 

Minha experiencia de 20 anos de ensino de bioestatistica, modelagem e metodos quan¬ 
titativos aplicados a ecologia e a biologia evolutiva mostra que nao e facil, para a maior parte 
dos alunos, romper essas barreiras de aprendizado. Por outro lado, quando isso acontece, esses 
alunos passam a se desenvolver academicamente de forma muito mais adequada e se tornam 
profissionais muito competentes, independente de sua area de atua^ao dentro da biologia. 
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Isso mostra, portanto, que o esfor^o dos professores em tentar ajudar os alunos a romper essas 
barreiras vale a pena. Para isso, e crucial ter, como ponto de partida, bons livros-texto. Sem 
duvida, em um contexto de metodos quantitativos aplicados a biologia e a ecologia, ha textos 
excelentes (destaco os meus preferidos aqui: Biometry , de R. R. Sokal e F. J. Rohlf, e Numerical 
ecology , de P. Legendre & E. Legendre), mas em ingles, o que torna dificil sua indica^ao porque 
muitos estudantes de gradua^ao e pos nao dominam a lingua. 

Prindpios de estatistica em ecologia , do Dr. Nicholas Gotelli, da Universidade de Ver¬ 
mont, e de Aaron Ellison, publicado agora em portugues pela Artmed, com certeza sera im- 
portante para preencher a lacuna de livros-texto adequados para o ensino de bioestatistica, 
sobretudo em um contexto de ecologia e biologia evolutiva. Um dos livros anteriores do 
Dr. Gotelli, Primer of ecology*, tambem possui a mesma caracteristica, sendo um excelente 
texto com uma visao mais quantitativa, auxiliando o ensino de ecologia ao dar aos estudantes 
a possibilidade de compreender, de modo mais detalhado, alguns modelos e conceitos, abor- 
dados de forma geral em textos mais basicos, como os de R. E. Ricklefs, M. Begon e E. Pianka. 

Prindpios de estatistica em ecologia , de Gotelli & Ellison, possui todas as caracteristicas 
importantes de um excelente livro-texto, escrito em uma linguagem atual e moderna, para o 
ensino de metodos quantitativos em ecologia, tanto para cursos basicos de bioestatistica para 
a gradua^ao em biologia e areas afins como para cursos mais avan^ados em ecologia quantita¬ 
tiva. Embora alguns exemplos trabalhados sejam apresentados, a maior enfase e dada na inter- 
preta<;ao dos resultados das analises e na discussao de como diferentes problemas podem ser 
resolvidos utilizando-se metodos observacionais ou experimentais (o que o torna um pouco 
diferente das obras antes citadas e de varios outros textos de bioestatistica em portugues, que 
tendem a enfatizar inclusive uma abordagem experimental). Creio que isso reflete a mudan^a 
na facilidade computacional com que os diferentes metodos podem ser aplicados atualmente 
e, ao mesmo tempo, um aumento enorme na sua complexidade (de modo que seria extrema- 
mente complicado, e de fato de pouca utilidade, apresentar exemplos detalhados). 

Alem do cuidado com a interpreta<;ao e aplica^ao dos metodos, existem, sem duvida, 
diversos outros aspectos que merecem destaque nesta obra de Gotelli & Ellison e que a tornam 
muito atraente. Um deles e a apresenta^ao clara e imparcial de diferentes arcabou^os teoricos 
dentro da estatistica, incluindo uma discussao sobre metodos classicos de inferencia, metodos 
bayesianos e processos de Monte Carlo. Outro aspecto importantissimo e o resgate, na forma 
de notas contendo curtas biografias e curiosidades, do papel de cientistas importantes e do 
contexto historico com que metodos e conceitos importantes foram desenvolvidos. O livro 
tambem tern uma se^ao sobre metodos multivariados, algo bastante importante para os eco- 
logos (mas, em geral, negligenciado nos textos basicos de bioestatistica). 

Enfim, e extremamente recompensador poder usar esta obra em nossos cursos de ecolo¬ 
gia quantitativa, bioestatistica e modelagem: Dr. Gotelli e, sem duvida, um dos mais renoma- 
dos pesquisadores em ecologia quantitativa da atualidade (e, alem disso, um musico entusiasta 
- vale a pena conferir tudo isso em sua webpage, http://www.uvm.edu/~ngotelli/homepage. 
html). Este livro, que a Artmed nos proporciona agora em portugues, mostra claramente que, 
alem de ser um pesquisador brilhante e inovador em varios aspectos, Dr. Gotelli possui uma 
preocupa^ao genuina com a forma^ao dos jovens pesquisadores interessados em metodos 
computacionais e estatisticos aplicados a ecologia. 

Jose Alexandre Felizola Diniz Filho 

Professor titular do Departamento de Ecologia do 
Instituto de Ciencias Biologicas da Universidade Federal de Goias 


N. de R. T. Publicado no Brasil, em 2007, pela Editora Planta, sob o titulo Ecologia. 
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P or que mais um livro de estatistica? Este campo ja tem muitos textos de biometria, 
teoria de probabilidades, delineamento experimental e analise de variancia. A res- 
posta e que ainda e preciso encontrar um unico texto que seja capaz de unir as duas ne- 
cessidades especificas dos ecologos e cientistas da area ambiental. A primeira e uma intro¬ 
duce) geral a teoria de probabilidades, incluindo os pressupostos da inferencia estatistica 
e o teste de hipoteses. A segunda e uma descri^ao detalhada de delineamentos e analises 
especificas, tipicamente encontrados em ecologia. 

Esta obra e resultado de varias decadas de ensino de estatistica para estudantes de gra¬ 
duate e pos-gradua^ao na University of Oklahoma, na University of Vermont, no Mount 
Holyoke College e na Harvard Forest. Representa nossa perspectiva sobre o que e impor- 
tante na interface ecologia e estatistica, e a forma mais efetiva de ensina-la. Este e o livro 
que gostariamos de ter em maos quando estudamos ecologia na faculdade. 

“Principios”* sugere um livro curto, com mensagens simples e recomenda^oes seguras 
para os usuarios. Se a estatistica fosse tao simples! O assunto e amplo, e novos metodos e 
programas de computador surgem para os ecologos quase mensalmente. Apesar do tama- 
nho do livro (algo para o qual ficamos atentos), ainda o vemos como uma destila^ao do co- 
nhecimento estatistico. Incluimos as exposi<;6es classicas, bem como as discussoes sobre os 
metodos e as tecnicas mais recentes, com o objetivo de que seja litil tanto para graduandos 
como para pesquisadores experientes. Como na arte e na musica, ha um forte elemento de 
estilo e preferences pessoais na escolha e aplica^ao da estatistica. Explicamos nossas predi- 
le<;6es por certos tipos de analises e delineamentos, mas os leitores e usuarios de estatistica 
deverao, ao final, escolher seu proprio conjunto de ferramentas estatisticas. 

COMO UTILIZAR ESTE LIVRO 

Contrastando com muitas obras de estatistica direcionadas a biologos e ecologos - textos 
de “biometria” -, este nao e um livro de “receitas”, nem e um conjunto de exercicios e pro- 
blemas atrelados a um programa de computador em particular, que provavelmente esta- 
ria ultrapassado. Apesar de o livro conter equates e deriva^oes, nao se trata de um texto 
estatistico formal, com provas matematicas detalhadas. E, sim, uma exposi^ao de topicos 
basicos e avan<;ados importantes especificamente para ecologos e cientistas da area am¬ 
biental. E indicado para ser lido e utilizado talvez como um livro suplementar a outro mais 


* N. de R.T. No original, A primer of ecological statistics. A tradu^ao literal de primer seria “cartilha”, 
porem este termo e mais utilizado em literatura infantil na lingua portuguesa, pelo menos no Brasil. 
Por isso, preferimos utilizar como titulo Principios de estatistica em ecologia , em vez de Cartilha de 
estatistica aplicada a ecologia. 
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tradicional, ou como um livro independente para estudantes que tiveram uma introdu^ao 
minima a estatistica. Esperamos, tambem, que esta obra tenha seu lugar na prateleira (ou 
no chao) de profissionais da area ambiental, que necessitam usar e interpretar estatistica 
diariamente, mas que nao tenham um treinamento formal ou o auxilio de estatisticos. 

Aqui, fazemos bom uso de notas de rodape. Tal recurso permite-nos expandir o con- 
teudo e tratar de temas mais complexos, que poderiam comprometer o texto principal. 
Algumas notas de rodape sao puramente historicas; outras cobrem detalhes de provas ma- 
tematicas e estatisticas; outras, ainda, sao breves ensaios sobre topicos da literatura em 
ecologia. Quando graduandos, eramos apaixonados pelo classico de Hutchinson, An intro¬ 
duction to population biology (Yale University Press 1977). O uso liberal de notas de rodape 
por Hutchinson e suas frequentes incursoes na historia e filosofia nos serviram de modelo 
estilistico. 

Encontrar um equilibrio entre concisao e abrangencia tambem esteve entre nossos 
objetivos. Muitos topicos aparecem em mais de um capitulo, apesar de algumas vezes isso 
ocorrer em contextos um pouco diferentes. Como o Capitulo 12 requer algebra de matri- 
zes, providenciamos um breve apendice que cobre o essencial em nota^ao e manipula^ao 
de matrizes. Por fim, incluimos um glossario abrangente de termos usados em estatistica 
e teoria de probabilidades, o qual pode ser util tambem para a compreensao de metodos 
estatisticos apresentados em artigos cientificos. 

CONTEUDOMATEMATICO 

Apesar de nao nos esquivarmos das equates quando necessarias, ha consideravelmente 
menos matematica aqui do que em muitos textos de nivel intermediary. Tambem tenta- 
mos ilustrar todos os metodos com analises empiricas. Em quase todos os casos, foram 
usados dados de nossos proprios estudos para ilustrar a progressao de dados brutos para 
resultados estatisticos. 

Embora os capitulos sejam individualizados, ha uma consideravel referenda cruzada. 
Os Capitulos 9-12 cobrem os topicos tradicionais de muitos textos de biometria e contem 
maior concentra^ao de formulas e equates. O Capitulo 12, sobre metodos multivariados, 
e o mais avan^ado. Apesar de tentarmos explica-los com uma linguagem simples (nao foi 
uma tarefa facil!), nao ha como “embelezar” a pesada dose de algebra de matrizes e o novo 
vocabulario necessario para as analises multivariadas. 

ABRANGENCIA E TOPICOS 

A estatistica e um campo envolvente, no qual novos metodos sempre sao desenvolvidos para 
responder questoes ecologicas. Este livro reune, contudo, o que acreditamos ser fundamental 
para qualquer analise estatistica. O livro e organizado em torno de estatisticas com base para 
delineamento - para serem usadas em estudos observacionais ou experimentos delineados. 
(Uma estrutura alternativa seria estatistica com base para modelos, incluindo criterios de sele- 
^ao de modelos, analises de verossimilhan^a, modelagem inversa e outros metodos do tipo.) 

Qual e a diferen^a entre essas duas abordagens? Em resumo, analises com base em de¬ 
lineamento tratam primeiramente o problema P (dados | modelo): acessar a probabilidade 
dos dados conforme o modelo que especificamos. Um elemento importante de analises 
com base em delineamento e ser explicito a respeito do modelo subjacente. Em contraste, 
estatisticas com base em modelos tratam o problema P (modelo | dados), ou seja, acessar a 
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probabilidade de um modelo conforme o conjunto de dados presente. Metodos com base 
em modelos frequentemente sao mais apropriados para grandes conjuntos de dados que 
podem nao ter sido coletados de acordo com uma estrategia amostral explicita. 

Discutimos, tambem, modelos bayesianos, que de alguma forma estao entre essas duas 
abordagens. Metodos bayesianos tratam P (modelo | dados), mas podem ser usados com da¬ 
dos de experiments e estudos observacionais delineados. 

Esta obra foi dividida da seguinte forma: A Parte I discute os fundaments de proba¬ 
bilidade e do pensamento estatistico, introduz a logica e a linguagem de probabilidades 
(Capitulo 1), explica distributes estatisticas comumente usadas em ecologia (Capitulo 
2) e apresenta importantes medidas de aloca^ao e dispersao (Capitulo 3). O Capitulo 4 
mais se assemelha a uma discussao filosofica acerca de testes de hipoteses, com cuidado- 
sas explicates dos erros Tipo I e Tipo II e a ubiqua premissa do U P < 0,05”. O Capitulo 5 
apresenta os tres maiores paradigmas das analises estatisticas (frequentista, Monte Carlo e 
bayesiano), ilustrando seus usos atraves da analise de um unico conjunto de dados. 

A Parte II discute como delinear e executar estudos observacionais e experiments de 
campo com sucesso. Seus capitulos reunem conselhos e informates para serem utilizados 
antes da coleta de qualquer dado no campo. O Capitulo 6 trata dos problemas praticos de 
articular a razao para um estudo, ajustando um tamanho amostral e tratando a indepen¬ 
dence, a replica^ao, a aleatoriza^ao, os estudos de impacto e a heterogeneidade ambien- 
tal. O Capitulo 7 e um bestiario* em delineamento experimental. Contudo, em contraste 
com quase todos os outros capitulos, quase nao ha equates nele. Discutimos as formas e 
fraquezas de diferentes delineamentos sem encalhar em equates ou tabelas de analise de 
variancia (ANOVA), que foram, em sua maioria, colocadas em quarentena na Parte III. O 
Capitulo 8 trata do problema de como manter e gerir dados uma vez coletados. Transfor- 
mates de dados sao introduzidas nesse capitulo como uma forma de ajudar na procura 
de pontos discrepantes ( outliers ) e erros na transcri^ao de dados. Tambem enfatizamos a 
importancia de criar metadados - documenta^ao que acompanha os dados brutos para 
uma armazenagem de longa dura^ao. 

A Parte III discute analises especificas e engloba o conteudo que e a essencia da maioria 
dos texts de estatistica. Seus capitulos desenvolvem muitos modelos basicos, mas tam¬ 
bem tentam apresentar mais algumas ferramentas atuais consideradas uteis pelos ecologos 
e cientistas da area ambiental. O Capitulo 9 desenvolve o modelo basico de regressao linear, 
regressao de quantil, regressao robusta e analise de caminhos. O Capitulo 10 discute mode¬ 
los de ANOVA (Analise de Variancia) e de ANCOVA (Analise de Covariancia), destacando 
qual modelo de ANOVA e apropriado para determinados delineamentos experimentais e 
amostrais. O capitulo tambem explica como usar contrastes a priori e enfatiza a representa- 
<;ao grafica dos resultados de ANOVA de um modo que facilita o entendimento dos efeitos 
principals e os termos de intera^ao. O Capitulo 11 discute analise de dados categoricos, com 
enfase em analises de chi-quadrado de tabelas de contingencia de um e dois fatores e mode- 
lagem log-linear de tabelas de contingencia multiplas. O Capitulo 12 introduz uma varieda- 
de de metodos multivariados para ordena<;ao e classifica^ao. O capitulo apresenta, por fim, 
uma introdu<;ao a analise de redundancia, um analogo multivariado da regressao multipla. 


* N. de R.T. Bestiario e um tipo de livro escrito na Idade Media que continha ilustra^oes e describes 
de animais reais e imaginarios com intuito de ensinar moral e entreter. No context deste livro, um 
“bestiario de delineamentos experimentais” indica que o capitulo sera compost por figuras que 
ilustram cada tipo de delineamento experimental em adi^ao ao text que os descrevem. 
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RECURSOS DIDATICOS PARA PROFESSORES 

Em www.artmed.com.br, professores terao acesso a PowerPoints® (em portugues) com as 
figuras da obra, que poderao ser utilizados para preparar suas aulas. 
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Figura 1.1 Histograma da frequenoa de capturas. I 
vestigador poderia observar a vlsita de 1.000 insetos i 
vezes a planta capturou um inseto Wet Tabela 1.1). Os 
(uma por semana) podem ser plotados na forma de 
vado varia de um mlnimo de 4 em uma semana (colur 
em outra jcoluna da extrema direita); a media aritmeti 
a cada I.OOOvisitas. 



Figura 2.4 Distribuicao uniforme com intervab [0,10]. Em uma distribuifio uniforme continua, 
a probabilidade de um evento ocorrer em um subintervalo particular depende da it ea relativa do 
subintervalo: ela e a mesma independente de onde o subintervalo esta inserido dentro dos limites 
da distribui^ao. Por exemplo, se a distribui^ao £ delimitada por 0 e 10. a probabilidade de que um 
evento ocorra no subintervalo [3.4] 6 a area relativa delimitada por aquele subintervalo. que neste 
caso a 0,10. A probabilidade e a mesma para qualquer outro subintervalo com o mesmo tamanho, 
como 11.2] ou 14,5], Se o subintervalo escolhido e maior. a probabilidade de um evento ocorrer 
naquele subintervalo sera proporciorvalmente maior. Por exemplo, a probabilidade de um evento 
ocorrer no subintervalo [3.5] e de 0,20 (desde que 2 dentre as 10 unidades do intervalo sejam trans- 
passadas). e 4 de 0.6 para o subintervab [2.8], 
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S0BREACAPA 

A capa e uma pintura de natureza morta feita pela ecologa Elizabeth Farnsworth, inspi- 
rada pelas pinturas de natureza morta holandesas do seculo XVII. Os pintores da Holan- 
da, incluindo De Heem, Claesz e Kalf, mostraram sua habilidade arranjando e pintando 
uma grande variedade de objetos naturais e artificiais, frequentemente com ricas alusoes 
e simbolismo oculto. O belo e biologicamente acurado desenho de plantas e animais de 
Elizabeth segue a longa tradi<;ao de ilustradores da biologia, como Diirer e Escher. No 
desenho da ecologa, a pe^a central e uma ilustra^ao do Teorema de Bayes feito a mao, uma 
exposi<;ao matematica do seculo XVIII que permeia a essencia da teoria de probabilidades. 
Apesar de os metodos bayesianos modernos serem intensivos computacionalmente, o en- 
tendimento do Teorema de Bayes ainda requer que seja contemplado a mao. 

As pinturas holandesas de natureza morta frequentemente incluem instrumentos 
musicais, talvez simbolizando a beleza pitagoreana da musica e dos numeros. O desenho 
de Elizabeth incorpora o bouzouki (instrumento de cordas) de Aaron, como a escrita deste 
livro foi entrela^ada a muitas sessoes de musica acustica com Aaron e Elizabeth. 

O cranio humano e o simbolo tradicional da mortalidade em pinturas de natureza 
morta. Elizabeth o substituiu por um pequeno coral cerebro, em homenagem ao primeiro 
trabalho de disserta^ao de Nick (Gotelli) sobre ecologia de corais gorgonians subtropicais. 
A luz do atual colapso mundial dos recifes de corais, o coral cerebro parece um simbolo 
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apropriado para mortalidade. Em primeiro piano, uma formiga Atta carrega um frag- 
mento de texto com o sinal de somatorio, relembrando-nos do poder coletivo de formigas 
operarias individuais, pois a soma de suas atividades beneficia toda a colonia. Como nas 
pinturas medievais, a formiga e desenhada desproporcionalmente maior que os outros 
objetos, refletindo sua dominancia e importancia nos ecossistemas terrestres. No segundo 
piano esta um especime de Sarracenia minor , planta carnivora do sudeste dos EUA que e 
cultivada em estufa. Apesar de muito rara para manipulates experimentais em campo, 
nossos estudos em andamento sobre a Sarracenia purpurea , mais comum no nordeste dos 
EUA, podem nos ajudar a desenvolver estrategias efetivas de conserva^ao para todas as 
especies do genero. 

O elemento final neste desenho e um “jarro galinha”, da Renascen^a Italiana. No verao 
de 2001, estavamos investigando plantas-jarro em pantanos remotos das Montanhas Adi¬ 
rondack. Ao final de um longo dia de campo, em um pequeno restaurante italiano no sul 
de Vermont, pedimos e consumimos, um tanto sem modera^ao, um “jarro galinha” con- 
tendo um litro do vinho Chianti. Ao fim da noite, tinhamos nos comprometido a escrever 
este livro, e “A galinha” - como sempre o chamamos - oficialmente saiu do ovo. 

AGRADECIMENTOS 

Agradecemos a varios colegas por suas importantes sugestoes para diferentes capitulos: 
Marti Anderson (11,12), Jim Brunt (8), George Cobb (9,10), Elizabeth Farnsworth (1-5), 
Brian Inouye (6, 7), Pedro Peres-Neto (11,12), Catherine Potvin (9,10), Robert Rockwell 
(1-5), Derek Roff (proposta original do livro), David Skelly (proposta original do livro) e 
Steve Tilley (1-5). Discussoes em grupo no laboratorio em Harvard Forest e na University 
of Vermont tambem nos forneceram um retorno para muitas partes do livro. Creditos 
especiais vao para Henry Horn, que leu e criticou em detalhes todo o manuscrito. Agrade¬ 
cemos a Andy Sinauer, Chris Small, Carol Wigg, Bobbie Lewis e Susan McGlew, da Sinauer 
Associates, e, especialmente, Michele Ruschhaupt, do The Format Group, por transformar 
as paginas sem gra<;a do texto em word em um livro elegante e agradavel. 

A National Science Foundation ofereceu suporte ao nosso estudo com as plantas-jar¬ 
ro, formigas, modelos nulos e manguezais, os quais aparecem em muitos exemplos ao 
longo do livro. A University of Vermont e a Harvard Forest, nossas respectivas institutes 
de trabalho, proveram ambientes de suporte para sua escrita. 



< 


> 


Sumario 


Parte I 

FUNDAMENTOS DA PROBABILIDADE E DO PENSAMENTO 
ESTATISTICO 

1 Introdugao a Probabilidade 23 

2 Variaveis Aleatorias e Distributes de Probabilidades 45 

3 Estatisticas Descritivas: Medidas de Posi^ao e Dispersao 75 

4 Formulando e Testando Hipoteses 97 

5 Tres Estruturas Para Analises Estatisticas 125 

Parte II 

DELINEAMENTO DE EXPERIMENTOS 

6 Delineando Estudos de Campo com Sucesso 155 

7 Um Bestiario de Delineamentos Experimentais e Amostrais 181 

8 Gestao e Curadoria de Dados 225 

Parte III 

ANALISE DE DADOS 

9 Regressao 257 

10 Analise de Variancia 307 

11 Analise de Dados Categories 367 

12 Analise de Dados Multivariados 401 

Apendice Algebra de Matrizes para Ecologos 465 

Glossario 477 

Literatura Citada 499 

Indice 511 



Sumario Detalhado 


Parte I 

FUNDAMENTOS DA PROBABILIDADE 
E DO PENSAMENTO ESTATISTICO 


1 Introdugao a Probabilidade 23 

Oquee probabilidade? 24 

Medindo probabilidades 24 

A probabilidade de um evento 
unico: captura de presas por plantas 
carm'voras 24 

Estimando probabilidades por 
amostragem 27 

Problemas na defini^ao de 
probabilidade 29 

A matematica da probabilidade 31 

Definindooespa^oamostral 31 

Eventos complexos e compartilhados: 
combinando probabilidades simples 33 
Calculo de probabilidades: 
paineirinhaselagartas 35 

Eventos complexos e compartilhados: 
regras combinatorias de conjuntos 38 

Probabilidades condicionais 41 

Teorema de Bayes 42 

Resumo 44 

2 Variaveis Aleatorias e 

Distributes de Probabilidades 45 

Variaveis aleatorias discretas 46 

Variaveis aleatorias de Bernoulli 46 

Exemplo de uma tentativa 
de Bernoulli 47 

Muitas tentativas de Bernoulli = 
uma variavel aleatoria binomial 48 


A distribui^ao binomial 51 

Variaveis aleatorias de Poisson 54 

Um exemplo de variavel aleatoria 
de Poisson: distribuigao de uma 
planta rara 56 

0 valor esperado de uma variavel 
aleatoria discreta 59 

A variancia de uma variavel aleatoria 
discreta 59 

Variaveis aleatorias conti'nuas 61 

Variaveis aleatorias uniformes 62 

0 valor esperado de uma variavel 
aleatoria continua 64 

Variavel aleatoria normal 65 

Propriedades uteis da distribuigao 
normal 68 

Outras variaveis aleatorias conti'nuas 70 
0 teorema do limite central 72 

Resumo 74 

3 Estatfsticas Descritivas: 

Medidas de Posigao e Dispersao 75 

Medidas de posigao 76 

A media aritmetica 76 

Outras medias 78 

Outras medidas de posigao: 
a mediana e a moda 82 

Quando usar cada medida de 
posigao 83 

Medidas de dispersao 83 

A variancia e o desvio-padrao 84 

0 erro-padrao da media 85 

Assimetria (skewness), curtose e 
momento central 87 

Quantis 89 



Sumario Detalhado 17 


Usando as medidas dedispersao 90 

Algumas questoes filosoficas em 
torno das estati'sticas descritivas 91 

Intervalos de confian^a 92 

Intervalos de confian^a generalizados 94 
Resumo 95 

4 Formulando e Testando Hipoteses 97 

Metodos cienti'ficos 98 

Dedu^ao e indu^ao 98 

A indu^ao nos dias modernos: 
inferencia bayesiana 101 

0 metodo h i potetico-ded utivo 105 

Testando hipoteses estati'sticas 108 

Hipotese estati'stica versus retorno 
a hipotese cientifica 108 

Significance estati'stica e valores 
deP 109 

Erros em testes de hipoteses 117 

Estimativa de parametros e predi^ao 121 

Resumo 123 

5 Tres Estruturas Para Analises 

Estatisticas 125 

Problema amostral 125 

Analises de Monte Carlo 128 

Passo 1: especificando o teste 
estati'stico 129 

Passo 2: criando a distribui^ao nula 129 

Passo 3: decidindo sobre urn teste 
uni ou bicaudal 130 

Passo 4: calculando a probabilidade 
decauda 132 

Premissas do metodo de Monte Carlo 133 
Vantagens e desvantagens do 
metodo de Monte Carlo 133 

Analises parametricas 135 

Passo 1: especificando a 
estatistica-teste 135 

Passo 2: especificando a distribui^ao 
nula 137 

Passo 3: calculando a probabilidade 
decauda 137 

Premissas do metodo parametrico 138 


Vantagens e desvantagens do 
metodo parametrico 139 

Analises nao parametricas: um caso 
especial de analise de Monte Carlo 139 

Analises bayesianas 140 

Passo 1: especificando a hipotese 140 

Passo 2: especificando os parametros 
como variaveisaleatorias 142 

Passo 3: especificando a distribui^ao 
de probabilidades de priores 143 

Passo 4: calculando a verossimilhan^a 147 

Passo 5: calculando a distribui^ao de 
probabilidades a posteriori 147 

Passo 6: interpretando os resultados 148 

Premissas da analise bayesiana 150 

Vantagens e desvantagens da 
analise bayesiana 150 

Resumo 151 


Parte II 

DELINEAMENTO DE EXPERIMENTOS 


6 Delineando Estudos de Campo 

comSucesso 155 

Qual e a questao central do estudo? 155 
Existem diferen^as espaciais ou 
temporais na variavel V? 155 

Qual e o efeito do fator X sobre a 
variavel V? 156 

As medidas da variavel Y sao 
consistentes com as predi^oes da 
hipotese H? 156 

Usando as medidas da variavel 
qual e a melhor estimativa do 
parametro 0 no modeloZ? 157 

Experimentos manipulativos 157 

Experimentos naturais 159 

Experimentos fotograficos versus 
experimentos detrajetoria 161 

O problema da dependence 
temporal 162 

Experimentos de pressao versus 
experimentos depulsos 164 

Replica^ao 166 



18 Sumario Detalhado 


Quantas replicas? 166 

Quantas replicas sao possiveis 
no total? 166 

ARegradoslO 167 

Estudos em larga escala e impactos 
ambientais 168 

Garantindo independence 169 

Evitandofatoresconfundidos 171 

Replica<;aoe randomiza^ao 172 

Delineando experimentos de campo 
e estudos amostrais efetivos 176 

As parcelas ou os cercados sao 
grandes o suficiente para garantir 
resultados realisticos? 176 

Qual e o grao e a extensao 
doestudo? 176 


A amplitude dos tratamentos ou das 
categorias dos censos engloba ou 
abrange a amplitude de condi^oes 
ambientais possiveis? 177 

Foram estabelecidos controles 
apropriados para garantir que os 
resultados refletem varia^ao 
apenas nofatorde interesse? 178 

Todas as replicas foram manipuladas 
da mesma forma, exceto para a 
aplica^ao intencional do tratamento? 178 


As covariaveis apropriadas foram 
medidasemcada replica? 179 

Resumo 179 

7 Um Bestiario de Delineamentos 
Experimentais e Amostrais 181 

Variaveis categoricas versus variaveis 
continuas 182 

Variaveis dependentes e 
independentes 183 

Quatro classes de delineamentos 
experimentais 183 

Delineamentos de regressao 184 

Delineamentos deANOVA 189 

Alternativas a ANOVA: 
experimento de regressao 215 

Delineamentos tabulares 218 


Alternativas para os delineamentos 


tabulares: delineamentos 
proporcionais 221 

Resumo 222 

8 Gestao e Curadoria de Dados 225 

O primeiro passo: gestao de 
dados brutos 226 

Planilhas 226 

Metadados 227 

0 segundo passo: armazenamento e 
curadoria de dados 228 

Armazenamento: temporario e 
permanente 228 

Curadoria de dados 229 

0 terceiro passo: verificagao 
dos dados 230 

A importance dos dados 
discrepantes 230 

Erros 232 

Dados faltantes 233 

Detectando discrepancias e erros 233 

Criando um rastro de auditoria 241 

0 passo final: transforma^ao 
de dados 241 

Transforma^oes de dados como 
ferramenta cognitiva 242 

Transforma$oes de dados por 
demanda estatistica 246 

Apresentando resultados: 
transformados ou nao? 250 

0 rastro de auditoria revisitado 251 

Resumo: o fluxograma de 
gerenciamento de dados 251 


Parte III 

ANALISE DE DADOS 

9 Regressao 257 

Definindo uma linha reta e seus 
dois parametros 257 

Ajustando dados a um modelo linear 259 
Variances ecovariancias 262 



Sumario Detalhado 19 


Estimativa de parametro por 
mi'nimosquadrados 264 

Componentes de variancia e 
coeficientede determinate) 266 

Testes de hipoteses com regressao 268 

Aanatomiadeumatabela ANOVA 268 

Outros testes e intervalos de 
confianga 271 

Pressupostos da regressao 275 

Testes de diagnostico para 
a regressao 277 

Representato grafica dos residuos 277 

Outros graficosde diagnostico 280 

Afuntodeinfluencia 280 

Monte Carlo e analise bayesiana 282 

Regressao linear usando metodos 
de Monte Carlo 283 

Regressao linear usando metodos 
bayesianos 283 

Outros tipos de analises de regressao 286 
Regressao robusta 286 

Regressao quantilica 289 

Regressao logistica 291 

Regressao nao linear 293 

Regressao multipla 293 

Analisedecaminhos 297 

Criterios para sele<;ao de modelos 300 

Metodos de selegao de modelos 
para regressao multipla 301 

Metodos de sele^ao de modelos 
na analisedecaminhos 302 

Seleto de modelos bayesianos 303 

Resumo 305 

10 Analise de Variancia 307 

Simboloserotulosem ANOVA 308 

Anova e parti^ao da soma dos 
quadrados 308 

Os pressupostos da ANOVA 313 

Testes de hipoteses com ANOVA 314 

Construindo razoes-F 316 

Urn bestiariode tabelas de ANOVA 318 

Blocos aleatorizados 318 

ANOVA aninhada 320 


ANOVA de dois fatores 322 

ANOVA para delineamentos com 
tres fatores e para n-fatores 326 

ANOVA de parcelas subdivididas 326 

ANOVA de medidas repetidas 327 

ANCOVA 332 

Fatores aleatorios versus fatores fixos 
em ANOVA 335 

Parti^ao de variancia na ANOVA 340 

Apos a anova: plotando e 
entendendo os termos de intera^ao 342 
Plotando resultados de ANOVAs 
de um fator 343 

Plotando resultados de ANOVAs 
de dois fatores 345 

Entendendo os termos de interagao 349 

Plotando resultados de ANCOVAs 350 

Comparando medias 352 

Compara^oes a posteriori 354 

Contrastes a priori 356 

Corre<;6es de Bonferroni e o 
problema dos testes multiplos 362 

Resumo 366 

11 Analise de Dados Categoricos 367 

Tabelas de contingency de 
dois fatores 368 

Organizando os dados 368 

As variaveis sao independentes 370 

Teste de hipoteses: teste de 
chi-quadrado de Pearson 372 

Uma alternativa ao teste de 
chi-quadrado de Pearson: o teste-G 375 

O teste de chi-quadrado e o 
teste-G para tabelas L x C 377 

Qual teste escolher? 381 

Tabelas de contingency multifatoriais 382 
Organizando os dados 382 

Sobre as tabelas multifatoriais! 386 

Abordagens bayesianas para 
tabelas de contingency 393 

Testes para bondade do ajuste 393 

Teste de bondade do ajuste para 
distributes discretas 394 



20 Sumario Detalhado 


Teste da bondade do ajuste a 
distributes conti'nuas: o teste de 
Kolmogorov-Smirnov 398 

Resumo 399 

12 Analise de Dados Multivariados 401 

Abordando dados multivariados 402 

A necessidade da algebra 
de matrizes 402 

Comparando medias multivariadas 405 

Comparando medias multivariadas 
de duas amostras: Teste T 2 
de Hotelling 405 

Comparando medias multivariadas 
de mais de duas amostras: 
uma MANOVA simples 408 

A distribui$ao normal multivariada 412 

Teste de normalidade multivariada 413 

Medidas de distancia multivariada 416 

Medindo distances entre dois 
indivfduos 416 

Medindo distances entre 
dois grupos 420 

Outras medidas de distancia 420 

Ordena^ao 424 

Analise de componentes principals 424 


Analise fatorial 433 

Analise de coordenadas principals 436 
Analise de correspondence 439 

Escalonamento multidimensional 
nao metrico 443 

Vantagens e desvantagens da 
ordena$ao 445 

Classifica^ao 447 

Analise deagrupamentos 447 

Escolhendo urn metodo de 
agrupamento 448 

Analise discriminante 451 

Vantagens e desvantagens da 
classificagao 455 

Regressao multipla multivariada 455 

Analise de redundance 456 

Resumo 462 

Apendice Algebra de Matrizes 

para Ecologos 465 

Glossario 4 77 

Literatura Citada 499 

Indice 511 



Parte I 



FUNDAMENTOS DA 
PROBABILIDADE E DO 
PENSAMENTO ESTATISTICO 
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1 

IntroduQo a 
Probabilidade 


N este capitulo, desenvolveremos conceitos basicos e defini^oes necessarias 
para entender probabilidade e amostragem. Os detalhes do calculo de pro- 
babilidades estao por tras da computa<;ao de todos os testes estatisticos de signi- 
ficancia. Desenvolver uma aprecia^ao pela probabilidade ajuda a melhor delinear 
experimentos e a interpretar seus resultados com mais clareza. 

Os conceitos deste capitulo estabelecem os alicerces para o uso e entendimento 
da estatistica. Eles sao mais importantes, de fato, do que alguns dos topicos detalha- 
dos que o seguirao. Este capitulo fornece o conhecimento necessario para questoes 
criticas como “O que quer dizer, em um artigo cientifico, que as medias de duas 
amostras diferem significativamente a um P = 0,003?” ou “Qual a diferen<;a entre os 
erros estatisticos do Tipo 1 e do Tipo 2?” Voce ficaria surpreso ao saber que muitos 
cientistas com consideravel experiencia em estatistica sao incapazes de responder 
claramente a essas questoes? Se voce entender o conteudo deste capitulo introduto- 
rio, tera uma base forte para o seu estudo de estatistica, e estara sempre apto a inter¬ 
pretar corretamente o conteudo estatistico na literatura cientifica - mesmo que nao 
esteja familiarizado com os detalhes particulares dos testes utilizados. 

Aqui, tambem apresentamos o problema de mensura^ao e quantifica^ao, pro¬ 
cesses que sao essenciais a todas as ciencias. Nao podemos come^ar a investigar 
fenomenos cientificamente, a menos que possamos quantificar processos e con- 
cordar, por meio de uma linguagem comum que possibilitara a interpreta^ao de 
nossas medi«;6es. E claro que o mero ato de quantifica^ao por si so nao faz de algo 
uma ciencia: a astrologia e a previsao do mercado de a^oes utilizam muitos nume- 
ros, mas nao se qualificam como ciencias. 

Um desafio conceitual para estudantes de ecologia e traduzir seu “amor pela natu- 
reza” em um “amor ao padrao ” Por exemplo, como quantificamos padroes na abun- 
dancia de plantas e de animais? Quando caminhamos pela floresta, nos fazemos uma 
serie de questoes, como: “Qual a nossa melhor estimativa para a densidade de colonias 
de Myrmica (formiga comum em florestas) nesta floresta? Seria de 1 colonia/m 2 ? 10 
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colonias/m 2 ? Qual seria a melhor maneira de medir a densidade de Myrmica ? Como 
a densidade de Myrmica varia em diferentes partes da floresta? Quais mecanismos ou 
hipoteses poderiam explicar tal varia^ao?” E, por fim, “Quais experimentos e observa¬ 
nces poderiamos fazer para estudar e testar ou refutar essas hipoteses?” 

Porem, uma vez que “quantificamos a natureza”, ainda temos de sumarizar, 
sintetizar e interpretar os dados que coletamos. Em todas as ciencias, a estatistica e 
a linguagem comum usada para interpretar nossas medidas e para testar e discri- 
minar entre nossas hipoteses. A probabilidade e a base da estatistica e, portanto, e 
o ponto de partida deste livro. 

0 QUE E PROBABILIDADE? 

Se a previsao do tempo diz que ha 70% de chance de chover, intuimos o que isso 
significa. Tal declara<^ao quantifica a probabilidade, ou o provavel resultado de 
um evento sobre o qual estamos inseguros. A incerteza existe porque ha variatpao 
no mundo, a qual nem sempre e previsivel. A varia<;ao em sistemas biologicos e 
especialmente importante; e impossivel entender conceitos basicos de ecologia, 
evolunao e ciencias ambientais sem uma aprecia^ao da varia^ao natural. 1 

Apesar de todos termos uma no^ao geral de probabilidade, defini-la com pre- 
cisao e outra questao. O problema em definir probabilidade e mais serio quando 
tentamos medir a de eventos reais. 


MEDINDO PROBABILIDADES 

A probabilidade de um evento unico: captura de presas por plantas carnivoras 

As plantas carnivoras sao bons sistemas para se pensar acerca da defini<;ao de 
probabilidade. A planta-jarro do norte* Sarracenia purpurea captura insetos 
em folhas cheias de agua da chuva." Alguns dos que visitam uma planta-jarro 


1 A varia^ao em peculiaridades entre individuos e um dos elementos-chave 
da teoria da evolu^ao e da sele(;ao natural. Uma das grandes contributes 
intelectuais de Charles Darwin (1809-1882) foi enfatizar a significance de tal 
varia^ao e de abandonar a camisa de for^a conceitual do “conceito tipologico 
de especie” que tratava as especies como entidades ftxas e estaticas com fron- 
teiras imutaveis e bem-definidas. 

Charles Darwin 

2 Plantas carnivoras sao um dos nossos organismos de estudos favo- 
ritos. Elas fascinam biologos desde que Darwin (1875) provou pela 
primeira vez que elas podem absorver nutrientes dos insetos. Plantas 
carnivoras possuem muitos atributos que as fazem sistemas ecologi- 
cos modelo (Ellison & Gotelli, 2001; Ellison et al., 2003). 


* N. de T. Em ingles, northern pitcher plant e uma planta com folhas que se assemelham a um jarro 
de agua, por isso denominada “planta-jarro” 



Planta-jarro (Sarracenia purpurea) 
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caem dentro dela e afundam; a planta extrai nutrientes da presa em decompo- 
si<;ao. Apesar de a armadilha ser uma admiravel adapta^ao evolucionaria para 
a vida carnivora, ela nao e tao eficiente, e a maioria dos insetos que visita a 
planta-jarro escapa. 

Como poderiamos estimar a probabilidade de que a visita de um inseto ira 
resultar em uma captura de sucesso? A forma mais simples seria registrar cuida- 
dosamente o numero de insetos que visitam a planta e quantos sao capturados. 
Visitar a planta e um exemplo do que os estatisticos chamam de evento. Um even- 
to e um processo simples, de inicio e fim bem reconheciveis. 

Neste universo simples, visitar uma planta e um evento que pode ter dois 
resultados: fuga ou captura. A captura da presa e um exemplo de resultado 
discreto, porque a ele pode ser atribuido um numero inteiro positivo. Por 
exemplo, voce poderia atribuir 1 para uma captura e 2 para uma fuga. O con- 
junto formado por todos os resultados possiveis de um evento e chamado de 
espa^o amostral. 3 4 Espa^os amostrais ou conjuntos compostos de resultados 
discretos sao chamados de conjuntos discretos, porque seus resultados sao 
todos contaveis. 1 


3 Mesmo nesse exemplo simples, as defini^oes sao trai^oeiras e nao abrangem todas as possibilidades. 
Por exemplo, alguns insetos voadores podem pairar sobre a planta e nunca toca-la, e alguns rastrea- 
dores, no entanto, podem explorar a superficie externa da planta, sem ultrapassar a borda, e entrar no 
jarro. Dependendo de quao preciso tentamos ser, essas possibilidades podem ou nao ser incluidas no 
espa<;o amostral de observances usado para determinar a probabilidade de ser capturado. O espat^o 
amostral estabelece o dominio de inferencia do qual podemos tirar conclusoes. 

4 0 termo contavel tern um significado muito especifico na matematica. 
Um conjunto e considerado contavel se a todos os elementos (ou resulta¬ 
dos) daquele conjunto pode ser atribuido um valor inteiro. Por exemplo, 
podemos atribuir aos elementos do conjunto visita os inteiros 1 (= captu¬ 
ra) e 2 (= fuga). O conjunto de numeros inteiros por si so e contavel, mes¬ 
mo sabendo que ha infinitos numeros inteiros. No final dos anos 1800, 
o matematico Georg Ferdinand Ludwig Philipp Cantor (1845-1918), um 
dos fundadores do que veio a ser chamado de teoria dos conjuntos, de- 
senvolveu a no^ao de cardinalidade para descrever tal contabilidade. Dois 
conjuntos sao considerados como tendo a mesma cardinalidade se eles podem ser colocados em 
correspondence um com o outro de um para um. Por exemplo, os elementos do conjunto de 
todos os numeros pares {2,4,6,...} podem ser cada um atribuidos a um elemento do conjunto de 
todos os numeros inteiros (e vice-versa). Conjuntos que possuem a mesma cardinalidade que os 
numeros inteiros sao ditos como tendo cardinalidade 0, e sao denotados como N 0 Cantor tentou 
provar que o conjunto de numeros racionais (os que podem ser escritos como o quociente entre 
quaisquer dois numeros inteiros) tambem possuem cardinalidade X () , mas o conjunto de nume¬ 
ros irracionais (os que nao podem ser escritos como o quociente entre quaisquer dois numeros 
inteiros, como ^2) nao sao contaveis. O conjunto de numeros irracionais tern cardinalidade 1 e e 
denotado N r Um dos resultados mais famosos de Cantor foi de que existe uma correspondence 
de um para um entre o conjunto de todos os pontos do pequeno intervalo [0,1] e o conjunto de 
todos os pontos em um espa^o /^-dimensional (ambos tern cardinalidade 1). Tal resultado, publi- 
cado em 1877, o levou a escrever para o matematico Julius Wilhelm Richard Dedekind: u Eu vejo 
isso, mas eu nao acredito nisso!” Curiosamente, existem tipos de conjuntos que possuem cardi¬ 
nalidade maior que 1, e de fato existem infinitamente muitas cardinalidades. Ainda estranho, o 
conjunto dos numeros cardinais ( R 0 , N,, K 2 ,...) e, por si so, um conjunto contavel infinito. 



G. F. L. P. Cantor 
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Cada inseto que visita a planta e contado como uma observa^ao* *. Estatisticos 
em geral se referem a cada tentativa como uma replica individual e a um conjunto 
de tentativas como um experimented Definimos a probabilidade de um resulta- 
do como o numero de vezes que ele ocorre dividido pelo numero de observances. 
Se olhassemos uma unica planta e registrassemos 30 capturas de presas dentre 
3.000 visitas, poderiamos calcular a probabilidade como 

numero de capturas 
numero de visitas 

ou 30 em 3.000, que podemos escrever como 30/3.000, ou 0,01. Em termos mais 
gerais, calculamos a probabilidade P de um resultado ocorrer como sendo 

p _ numero de resultados (11) 

numero de observanoes 


Por defininao, nunca pode haver mais resultados do que observances, entao o 
numerador desta franao nunca e maior que o denominador, portanto 

0,0 <P< 1,0 

Em outras palavras, probabilidades sao sempre restringidas a um minimo de 
0,0 e a um maximo de 1,0. Uma probabilidade de 0,0 representa um evento que 
nunca ocorrera, uma probabilidade de 1,0, um evento que sempre ocorrera. 

Contudo, mesmo esta estimativa e problematica. A maioria das pessoas pode- 
ria dizer que a probabilidade de que o sol ira nascer amanha e uma coisa certa (P 
= 1,0). Certamente, se registrassemos assiduamente o nascer do sol a cada manha, 
verificariamos que ele sempre nasce, e nossa medida poderia, de fato, fornecer 
uma probabilidade estimada de 1,0. Mas o sol e uma estrela ordinaria, um reator 
nuclear que libera energia quando os atomos de hidrogenio se fundem para for- 
mar o helio. Apos cerca de 10 bilhoes de anos, todo o combustivel de hidrogenio 
se esgota e a estrela morre. O sol e uma estrela de meia idade, de forma que, se 
voce pudesse continuar observando-o por 5 bilhoes de anos, certa manha o sol 
poderia nao nascer mais. E se voce iniciasse suas observances naquele ponto, sua 
estimativa da probabilidade do sol nascer seria de 0,0. Entao, a probabilidade de o 
sol nascer a cada dia e realmente 1,0? Pouco menos que 1,0? E 1,0 na atualidade, 
mas 0,0 daqui a 5 bilhoes de anos? 

Este exemplo ilustra que qualquer estimativa ou medida de probabilidade 
condiz com a maneira como definimos o espano amostral - o conjunto de 


5 Esta defini^ao estatistica de experimento e menos restritiva que a convencional, que descreve um 
conjunto de aspectos manipulados (o tratamento) e um grupo comparativo apropriado (o controle). 
Contudo, muitos ecologos usam o termo experimento natural para se referir a compara<;6es entre 
replicas que nao foram manipuladas pelo investigador, mas que diferem naturalmente na quantidade 
de interesse (p. ex., ilhas com e sem predadores; ver Capitulo 6). 

* N. de T. Em ingles, trial tambem pode ser traduzido como “tentativa”. 
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todos os resultados possiveis que usamos para compara^ao. Em geral, todos 
temos estimativas intuitivas ou palpites de probabilidades para todos os ti- 
pos de eventos do cotidiano. Contudo, para quantificar esses palpites, devemos 
decidir sobre um espa^o amostral, colher amostras, e contar a frequencia de 
certos eventos. 

Estimando probabilidades por amostragem 

Em nosso primeiro experimento, observamos a visita de 3.000 insetos a planta; 
30 deles foram capturados e calculamos a probabilidade de captura de 001. Este 
numero e razoavel ou nosso experimento foi conduzido em um dia particular- 
mente bom para as plantas (ou um dia ruim para os insetos)? Sempre havera 
variabilidade neste tipo de numeros. Em alguns dias, nenhuma presa e captura- 
da; em outros, ha muitas capturas. Poderiamos determinar precisamente a ver- 
dadeira probabilidade de captura se observassemos cada inseto visitando uma 
planta todo tempo do dia ou da noite, a cada dia do ano. Cada vez que houvesse 
uma visita poderiamos determinar quando o resultado Captura ocorreu, e como 
consequencia atualizar nossa estimativa da probabilidade de captura. Mas a vida 
e muito curta para isso. Como poderiamos estimar a probabilidade de captura 
sem monitorar as plantas de forma constante? 

Podemos estimar de maneira eficiente a probabilidade de um evento cole- 
tando uma amostra da popula^ao de interesse. Por exemplo, em todas as sema- 
nas, por um ano inteiro, poderiamos escolher um dia e observar 1.000 visitas de 
insetos as plantas. O resultado e um conjunto de 52 amostras de 1.000 observa¬ 
nces cada, e o numero de insetos capturados em cada amostra. As tres primei- 
ras linhas desse conjunto de dados de 52 linhas sao mostradas na Tabela 1.1. As 
probabilidades de captura diferem entre os diferentes dias, mas nao por muito; 


TABELA 1.1 Dados amostrais para o numero de capturas de insetos a cada 1.000 
visitas a planta carnivora S arracenia purpurea 


Numero ID 

Data da observa^ao 

Numero de insetos capturados 

i 

1 de junho de 1998 

10 

2 

8 de junho de 1998 

13 

3 

15 de junho de 1998 

12 

52 

24 de maio de 1999 

11 


Neste conjunto de dados hipotetico, cada linha representa uma semana na qual uma amostra foi coletada. 
Se a amostragem foi conduzida uma unica vez na semana por um ano inteiro, o conjunto de dados deve 
ter exatamente 52 linhas. A primeira coluna indica o numero de identidade, uma sequencia unica de 
numeros inteiros (1 a 52) atribuidos a cada linha do conjunto de dados. A segunda coluna informa a data 
da amostra e a terceira o numero de capturas de insetos dentre as 1.000 visitas observadas. A partir desse 
conjunto de dados, a probabilidade de captura para cada amostra pode ser estimada como o numero de 
capturas/1.000. Os dados de todos os 52 numeros de captura podem ser plotados e sumarizados em um 
histograma que ilustra a variabilidade entre as amostras (ver Figura 1.1). 
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parece ser relativamente incomum para os insetos serem capturados enquanto 
visitam uma planta-jarro. 

Na Figura 1.1, sumarizamos concisamente os resultados de um ano de amos- 
tras 6 em um grafico chamado histograma. Neste, em particular, os numeros no 
eixo horizontal, ou eixo-x, indicam quantos insetos foram capturados enquanto 
visitavam plantas. Os numeros variam de 4 a 20, porque, nas 52 amostras, hou- 
ve dias em que apenas 4 foram capturados, dias em que 20 foram capturados 
e alguns dias neste intervalo. Os numeros do eixo vertical, ou eixo-)', indicam 
a frequencia: o numero de observances que tiveram um resultado particular. 
Por exemplo, houve apenas um dia no qual 4 capturas foram registradas; dois 



Numero de insetos capturados a cada 1.000 visitas 

Figura 1.1 Histograma da frequencia de capturas. Em cada semana, por um ano inteiro, um in- 
vestigador poderia observar a visita de 1.000 insetos a uma planta-jarro carnivora e contar quantas 
vezes a planta capturou um inseto (verTabela 1.1). Os dados coletados de todas as 52 observances 
(uma por semana) podem ser plotados na forma de um histograma. 0 numero de capturas obser- 
vado varia de um rm'nimo de 4 em uma semana (coluna na extrema esquerda) a um maximo de 20 
em outra (coluna da extrema direita); a media aritmetica de todas as 52 observances e 10,3 capturas 
a cada 1.000 visitas. 


6 Apesar de na verdade nao termos conduzido esse experimento, tais dados foram coletados por 
Newell & Nastase (1998), que filmaram a visita de insetos as plantas-jarro e registraram 27 capturas 
em 3.308 visitas, das quais 74 tiveram um destino desconhecido. Para as analises deste capitulo, 
simulamos dados usando um gerador de numeros aleatorios em uma planilha de computador. Para 
essa simulanao, estabelecemos a probabilidade “verdadeira” de captura em 0,01, o tamanho amostral 
em 1.000 visitas e o numero de amostras em 52. Usamos, entao, os dados resultantes para gerar o 
histograma da Figura 1.1. Se voce conduzir o mesmo experimento de simulanao no seu computador, 
obteria resultados similares, mas haveria alguma variabilidade, dependendo de como seu compu¬ 
tador gera numeros aleatorios. Discutiremos experimentos de simulanao com mais detalhes nos 
Capitulos 3 e 5. 





































Prindpios de Estati'stica em Ecologia 29 


dias com 6 capturas registradas; e cinco dias com 9 capturas. Uma maneira de 
estimar a probabilidade de captura e tirando a media aritmetica de todas as 
amostras. Em outras palavras, poderiamos calcular o numero medio de capturas 
em cada uma das 52 amostras de 1.000 visitas. Neste exemplo, o numero medio 
de capturas dentre essas visitas e 10,3. Assim, a probabilidade de ser capturado e 
de 10,3/1.000 = 0,0103, ou somente um pouco mais de um em 100. Chamamos 
essa media aritmetica de valor esperado da probabilidade , ou expectativa, e a 
denotamos como E(P). Distributes como a mostrada na Figura 1.1 sao fre- 
quentemente utilizadas para descrever os resultados de experimentos em proba¬ 
bilidade. Retornaremos a eles, em maiores detalhes, no Capitulo 3. 

PROBLEMAS NA DEFINI0O DE PROBABILIDADE 

A maioria dos livros-texto de estatistica define muito rapidamente probabilidade 
apenas como fizemos aqui: a frequencia (esperada) na qual eventos ocorrem. Os 
exemplos padrao dos livros-texto sao aqueles de que o lan<;amento de uma moeda 
honesta tern uma probabilidade de 0,50 (igual a uma chance de 50%) de sair cara, 7 
ou o de que cada face de um dado honesto de seis lados tern a chance de 1 em 6 de 
cair para cima. Porem, vamos considerar esses exemplos com mais cuidado. Por 
que aceitamos esses valores como as probabilidades corretas? 

Aceitamos essas respostas por causa da nossa visao de como moedas sao lan- 
^adas e de como os dados sao rolados. Por exemplo, se equilibrarmos uma moeda 
no topo de uma mesa com a “cara” virada para cima e entao tombarmos suave- 
mente o objeto para frente, todos concordariamos que a probabilidade de obter 
cara nao mais sera de 0,50. Em vez disso, a probabilidade de 0,5 se aplica somente 
a uma moeda que e lan^ada no ar.‘ s Mesmo assim, deveriamos reconhecer que 
a probabilidade de 0,50 representa realmente uma estimativa baseada em uma 
quantidade minima de dados. 

Por exemplo, suponha que temos uma vasta gama de microssensores de alta 
tecnologia aderida a superficie da moeda, nos musculos de nossa mao e nas 


7 Em um curioso lance do destino, uma das novas moedas de Euro pode nao ser honesta. A moeda 
do Euro, introduzida em 2002 por 12 estados europeus, tern um mapa da Europa no lado da “co- 
roa”, porem cada pais tern seu proprio desenho no lado da “cara” Os estatisticos poloneses Tomasz 
Gliszcynski e Waclaw Zawadowski lan^aram (na verdade rodopiaram) o Euro belga 250 vezes e ob- 
tiveram cara em 56% das vezes (140 caras). Eles atribuiram este resultado a uma imagem pesada 
embutida no lado “cara”, mas Howard Grubb, um estatistico da Universidade de Reading, apontou 
que de 250 observances, 56% “nao e significativamente diferente” de 50%. Quern esta certo? (como 
reportado em New Scientist : http://www.newscientist.com/, 2 de Janeiro de 2002). Retornaremos a 
este exemplo no Capitulo 11. 

h Apostadores e trapaceiros tentam contrariar este modelo usando moedas ou dados viciados, ou 
arremessando moedas ou dados cuidadosamente, de forma a favorecer uma das faces, mas dando 
a aparencia de aleatoriedade. Cassinos trabalham em vigilia para garantir que um modelo aleatorio 
seja executado; dados devem ser chacoalhados com vigor, as roletas giradas bem rapido, e as cartas 
do baralho de vinte um ( blackjack ) sao frequentemente embaralhas. Nao e necessario que o cassino 
trapaceie. As tabelas de premios sao calculadas para produzir um belo lucro, e tudo que o cassino tern 
a fazer e garantir que os clientes nao possam influenciar ou prever o resultado de cada jogo. 
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paredes da sala em que estamos. Esses sensores detectariam e quantificariam a 
exata quantidade de torque no nosso lan<;amento, a temperatura e turbulencia 
do ar na sala, as microirregularidades na superficie da moeda e os microturbi- 
lhoes na turbulencia do ar que sao gerados conforme a moeda gira. Se todos 
esses dados fossem instantaneamente passados para um computador, poderia- 
mos desenvolver um modelo muito complexo capaz de descrever a trajetoria 
da moeda. Com tal informa^ao, poderiamos prever, com muito mais acuracia, 
qual face da moeda ira cair para cima. De fato, se tivessemos uma quantidade 
infmita de dados disponiveis, talvez nao houvesse nenhuma incerteza no resul- 
tado do lan^amento da moeda. 9 No fim das contas, as observances que usamos 
para estimar a probabilidade de um evento podem nao ser tao similares. Cada 
observa^ao representa um conjunto de condi<;6es unico; uma cadeia de causa e 
efeito que determina inteiramente se o resultado sera cara ou coroa. Se pudesse- 
mos duplicar com perfe^ao esse conjunto de condi^oes, nao haveria nenhuma 
incerteza no resultado do evento e absolutamente nenhuma necessidade de usar 
probabilidade ou estatistica! 10 


9 Esta ultima declara^ao e bastante debatida. Ela assume que medimos todas as 
variaveis certas e que as intera^oes entre aquelas sao simples o suficiente para 
podermos mapear todas as contingencias ou as expressar em uma rela^ao ma- 
tematica. A maioria dos cientistas acredita que modelos mais complexos sao 
mais acurados que os mais simples, mas que pode nao ser possivel eliminar 
toda a incerteza. Note, tambem, que modelos complexos nao nos ajudam se 
nao podemos medir as variaveis que eles incluem; e improvavel que a tecno- 
logia necessaria para monitorar nosso arremesso da moeda exista em breve. 
Por fim, existe o problema mais subito de que o proprio ato de medir as coisas 
na natureza pode alterar o processo que estamos tentando estudar. Por exem- 
plo, suponha que desejamos quantificar a abundancia relativa de especies de 
peixes proximo ao fundo do oceano, onde a luz solar nunca penetra. Podemos 
usar cameras subaquaticas para fotografar peixes e entao contar o numero de 
peixes em cada fotografia. A luz da camera, porem, atrai algumas especies e 
repele outras. O que, exatamente, medimos? Na fisica, o Principio da Incer¬ 
teza, de Heisenberg (nome atribuido apos a morte do fisico alemao Werner 
Heisenberg), diz que e impossivel medir, de maneira simultanea, a posi^ao e o 
momento de um eletron: quanto mais acuradamente voce mede uma dessas 
quantidades, menos voce consegue medir a outra. Se o proprio ato de obser- 
var fundamentalmente causa mudan^as em processos na natureza, entao a 
cadeia de causa e efeito e quebrada (ou no minimo distorcida). Tal conceito foi formulado por Erwin 
Schrodinger (1887-1961), que colocou (teoricamente) um gato e um frasco de cianeto em uma caixa 
de quantum. Dentro da caixa, o gato pode estar simultaneamente vivo ou morto, porem uma vez que 
a caixa seja aberta e o gato observado, ele estara ou vivo ou morto eternamente. 

" Muitos cientistas poderiam adotar essa falta de incerteza. Alguns de nossos colegas biologos mo- 
leculares estariam muito felizes em um mundo no qual a estatistica fosse desnecessaria. Quando ha 
incerteza no resultado de seus experimentos, eles frequentemente assumem que foi devido a uma tec- 
nica mal empregada e que, eliminando os erros de medidas e a contamina<;ao, obterao dados limpos, 
repetiveis e corretos. Os ecologos e biologos de campo em geral sao mais veementes acerca da varia- 
$ao em seus sistemas. Nao so porque os sistemas ecologicos sao inerentemente mais residuais que os 
moleculares; em vez disso, dados ecologicos podem ser mais variaveis que moleculares, porque, com 
frequencia, sao coletados em diferentes escalas espaciais e temporais. 



Werner Heisenberg 



Erwin Schrodinger 
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Retornando as plantas-jarro, e obvio que nossas estimativas da probabilidade 
de captura irao depender muito dos detalhes de cada observa^ao. As chances de 
captura diferem entre as plantas grandes e pequenas, entre as presas formigas e 
as presas voadoras, e entre plantas ao sol e a sombra. E, para cada um desses gru- 
pos, poderiamos fazer subdivisoes adicionais baseadas em detalhes ainda mais 
refinados acerca das condi^oes da visita. Nossas estimativas de probabilidade irao 
depender de quao ampla ou restritamente limitaremos os tipos de observances 
que serao consideradas. 

Resumindo, quando dizemos que eventos sao aleatorios, estocasticos, pro- 
babilisticos ou devido a chance, o que realmente acontece e que os resultados 
sao determinados, em parte, por um conjunto complexo de processos que so- 
mos incapazes ou relutantes em medir e o tratamos como aleatorio. A for^a 
de outros processos que podemos medir, manipular e modelar representam 
fornas deterministicas ou mecanicistas. Podemos pensar nos padroes em nos- 
sos dados como sendo determinados por um misto de formas deterministicas e 
aleatorias. Como observadores, impomos uma distin^ao entre deterministico 
e aleatorio. Isso reflete em nosso modelo conceitual implicito acerca das formas 
em operanao, e na disponibilidade de dados e medidas que sao relevantes para 
essas formas. 11 

A MATEMATICA DA PROBABILIDADE 

Nesta sessao, apresentamos um breve tratamento matematico sobre como calcu- 
lar probabilidades. Apesar de o conteudo parecer tangencial a indaganao (os dados 
sao “ significativos ”?), a correta interpretanao de resultados estatisticos se articula 
sobre essas opera^des. 

Definindo o espa^o amostral 

Como ilustrado no exemplo da captura de presas pelas plantas carnivoras, a pro¬ 
babilidade P de ser capturado (o resultado) enquanto visita uma planta (o evento) 
e defmida simplesmente como o numero de capturas dividido pelo de visitas (o 


11 Se rejeitarmos a no$ao de qualquer aleatoriedade na natureza, rapidamente nos movemos para o 
dominio filosofico do misticismo: “Qual e, entao, a Lei do Carma? A Lei, sem exce^ao, que rege todo o 
universo, do invisivel e imponderavel atomo aos sois;... e esta lei diz que toda causa produz um efeito , 
sem qualquer possibilidade de atrasar ou anular o efeito, uma vez que a causa come^a a operar. A lei 
da causalidade e suprema em qualquer lugar. Eis a Lei do Carma; carma e a liga^ao inevitavel entre 
causa e efeito.” (Arnould 1895). 

A ciencia ocidental nao progride bem incorporando esse tipo de complexidade que tudo - en- 
globa. E verdade que muitas explicates cientificas para fenomenos naturais sao complicadas. Con- 
tudo, essas explicates sao obtidas, em prindpio, evitando toda complexidade e estabelecendo uma 
hipotese nula que tenta explicar padroes nos dados da forma mais simples possivel, o que significa, 
com frequencia, atribuir inicialmente a variato nos dados a aleatoriedade (ou erro de medi^ao). 
Se essa hipotese nula simples pode ser rejeitada, podemos passar a nos entreter com hipoteses mais 
complexas. Ver Capitulo 4 para mais detalhes sobre hipoteses nulas e teste de hipoteses. Ver y tambem 
Beltrami (1999) para uma discussao sobre aleatoriedade. 
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numero de observances) (Equa<;ao 1.1). Examinaremos em detalhes cada um des¬ 
ses termos: resultado, evento, observa^ao e probabilidade. 

Primeiro, precisamos definir nosso universo de eventos possiveis ou o espa^o 
amostral de interesse. Em nosso primeiro exemplo, um inseto poderia visitar com 
sucesso uma planta e sair, ou poderia ser capturado. Esses dois possiveis resulta- 
dos formam o espa^o amostral (ou conjunto), que chamamos de Visita: 

Visita = {( Captura ), (Fuga)} 

Usamos chaves {} para simbolizar o conjunto e parenteses () para simbolizar 
os eventos de um conjunto. Os objetos dentro dos parenteses sao resultados do 
evento. Como ha somente dois resultados possiveis para uma visita, se a proba¬ 
bilidade do resultado Captura e 1 em 1.000, ou 0,001, entao a probabilidade de 
fuga e de 999 em 1.000, ou 0,999. Este exemplo simples pode ser generalizado ao 
Primeiro Axioma da Probabilidade: 


Axioma 1: A soma de todas as probabilidades dos resultados em um unico 
espa«;o amostral = 1,0. 


Podemos escrever esse axioma como 

n 

J J P(A i ) = 1,0 

i =1 

que lemos como “a soma das probabilidades de todos os resultados A, e igual a 
1,0.” O “W de lado” (letra grega maiuscula sigma ) e o sinal de somatorio, a nota^o 
taquigrafica para somar os elementos a seguir. O i subscrito indica um elemento 
em particular e significa que iremos somar os elementos de i = 1 ate n , onde n e 
o numero total de elementos no conjunto. Em um espa<;o amostral propriamen- 
te definido, dizemos que os eventos sao mutuamente exdusivos (um individuo 
ou e capturado ou escapa), e que os resultados sao completos ( Captura ou Fuga 
sao os linicos resultados possiveis do evento). Se os eventos nao sao mutuamente 
exclusivos ou completos, as probabilidades dos eventos no espa<;o amostral nao 
somarao 1,0. 

Em muitos casos, havera mais que somente dois resultados possiveis para um 
evento. Por exemplo, em um estudo hipotetico da reprodu^ao de um besouro 
girinideo de manchas na cor laranja, estabelecemos que cada um desses animais 
sempre produz exatamente 2 proles, com 2 a 4 descendentes em cada uma. O 
sucesso reprodutivo no tempo de vida de um girinideo de manchas alaranjadas 
pode ser descrito como um resultado (a,b), onde a representa o numero de des¬ 
cendentes da primeira prole e b o numero de descendentes da segunda. O espa^o 
amostral Aptidao consiste em todos os resultados reprodutivos que um individuo 
pode obter durante sua vida: 

Aptidao = {(2,2), (2,3), (2,4), (3,2), (3,3), (3,4), (4,2), (4,3), (4,4)} 
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Como cada girinideo pode gerar apenas 2, 3 ou 4 descendentes por prole, 
esses 9 pares de numeros inteiros sao os unicos resultados possiveis. Na au- 
sencia de qualquer outra informa^ao, nos inicialmente partimos da premissa 
simplificada de que as probabilidades de cada um desses resultados reproduti- 
vos sao iguais. Usamos a defini^ao de probabilidade da Equa^ao 1.1 (numero 
de resultados/numero de observances) para determinar este valor. Visto que 
existem 9 resultados possiveis neste conjunto, P(2,2) = P(2,3) = ... = P(4,4) 
=1/9. Note tambem que as probabilidades obedecem ao Axioma 1: a soma das 
probabilidades de todos os resultados = 1/9 + 1/9 + 1/9 + 1/9 + 1/9 + 1/9 + 1/9 
+ 1/9 + 1/9 = 1,0. 

Eventos complexos e compartilhados: combinando probabilidades simples 

Uma vez que as probabilidades de eventos simples sao conhecidas ou foram esti- 
madas, podemos usa-las para medir probabilidades de eventos mais complicados. 
Os eventos complexos sao compostos por eventos simples do espa^o amostral. 
Os eventos compartilhados sao ocorrencias miiltiplas e simultaneas de eventos 
simples no espa<;o amostral. As probabilidades de eventos complexos e compar¬ 
tilhados podem ser decompostos nas somas ou produtos das probabilidades dos 
eventos simples. Contudo, pode ser dificil decidir quando as probabilidades de- 
vem ser adicionadas ou ser multiplicadas. A resposta pode ser obtida determinan- 
do se o novo evento pode ser atingido por uma das varias rotas diferentes (evento 
complexo), ou se ele requer a ocorrencia simultanea de dois ou mais eventos sim¬ 
ples (evento compartilhado). 

Se o novo evento pode ocorrer por diferentes rotas, ele e complexo e pode 
ser representado como uma declara^ao ou: Evento A ou Evento B ou Evento 
C. Desta forma, se diz que eventos complexos representam a uniao de eventos 
simples. As probabilidades de eventos complexos sao determinadas somando as 
de eventos simples. 

Em contraste, se novos eventos requerem a ocorrencia simultanea de varios 
eventos simples, ele e um evento compartilhado e pode ser representado como 
uma declara^ao e: Evento A e Evento B e Evento C. Eventos compartilhados, por- 
tanto, representam a interse^ao de eventos simples. As probabilidades de eventos 
compartilhados sao determinadas pela multiplica^ao das probabilidades. 

Eventos complexos: somando probabilidades O exemplo do girinideo pode 
ser utilizado para ilustrar o calculo da probabilidade de eventos complexos. Su- 
ponha que queremos medir o ganho da vida reprodutiva de um besouro girini¬ 
deo. Poderiamos contar o numero de descendentes que um girinideo produz em 
sua vida. Esse numero e a soma dos descendentes das duas proles, o que resulta 
em um numero inteiro entre 4 e 8. Como poderiamos determinar a probabilida¬ 
de de um girinideo de manchas alaranjadas produzir 6 descendentes? Primeiro, 
note que o evento que produz 6 descendentes pode ocorrer de tres formas: 

6 descendentes - {(2,4), (3,3), (4,2)} 



34 Nicholas J. Gotelli e Aaron M. Ellison 


e esse evento complexo e, por si so, um conjunto. 

Podemos ilustrar esses dois conjuntos com um diagrams de Venn. 12 A Figura 
1.2 ilustra o diagrama de Venn para nossos conjuntos de Aptidao e de 6 descenden¬ 
tes. Graficamente, voce pode ver que 6 descendentes e um subconjunto proprio do 
conjunto maior Aptidao (ou seja, todos os elementos do primeiro sao elementos 
do ultimo). Indicamos que um conjunto e um subconjunto do outro conjunto 
com o simbolo <z, e neste caso podemos escrever 

6 descendentes a Aptidao 

Tres dos 9 resultados possiveis de Aptidao produzem 6 descendentes, entao 
podemos estimar a probabilidade de ter 6 descendentes como sendo 1/9 + 1/9 + 
1/9 = 3/9 (relembrando nossa premissa de que cada resultado e equiprovavel). Tal 
resultado e generalizado no Segundo Axioma de Probabilidade: 

Axioma 2: A probabilidade de um evento complexo e igual a soma das pro- 
babilidades dos resultados que compoem aquele evento. 


Figura 1.2 Diagrama de Venn ilustrando 
o conceito de conjuntos. Cada par de nume- 
ros representa o numero de descendentes 
produzidos em duas proles consecutivas de 
uma especie hipotetica do besouro girini- 
deo. Assumimos que esse besouro produz 
exatamente 2, 3 ou 4 descendentes a cada 
vez que se reproduz, entao estes sao os 
unicos numeros inteiros que aparecem no 
diagrama. Um conjunto em um diagrama 
de Venn e um anel que compreende certos 
elementos. 0 conjunto Aptidao contem 
todos os resultados reprodutivos possiveis 
para duas proles consecutivas. Dentro do 
conjunto Aptidao, ha um conjunto menor 
6 descendentes, constituido pelas proles 
que produzem exatamente um total de 6 
descendentes (i.e., cada par de numeros 
inteiros somam 6). Dizemos que 6 descen¬ 
dentes e um subconjunto proprio de Apti¬ 
dao, pois os elementos do primeiro estao 
completamente contidos no segundo. 




12 John Venn (1834-1923) estudou em Gonville and Caius College, Cam¬ 
bridge University, Inglaterra, onde se graduou em 1857. Ele foi ordenado 
padre dois anos depois e retornou a Cambridge em 1962, como professor 
de Ciencia Moral. Ele tambem estudou e lecionou logica e teoria de pro- 
babilidades. Ele e mais conhecido pelos diagramas que representam con¬ 
juntos, suas unioes e intercedes, e agora esses diagramas levam seu nome. 
Venn tambem e lembrado por construir uma maquina para arremessar 
bolas de cricket. 


John Venn 
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Voce pode pensar em um evento complexo, como uma declara^ao ou em um 
programa de computador: se os eventos simples sao A, B e C, o evento complexo 
e (A ou B ou C), pois qualquer um desses resultados ira representar um evento 
complexo. Assim 


P(A ou BouC) = P(A) + P(B) + P(C) (1.2) 


Como outro exemplo simples, considere a probabilidade de retirar apenas uma 
carta de um baralho de 52 cartas e obter um As. Sabemos que ha 4 azes no baralho, 
e a probabilidade do evento complexo de tirar qualquer um dos 4 azes e de: 

P(As) = 1/52 + 1/52 + 1/52 + 1/52 = 4/52 = 1/13 

Eventos compartilhados: multiplicando probabilidades No exemplo do be- 
souro girinideo, calculamos a probabilidade de um girinideo produzir exata- 
mente 6 descendentes. Este evento complexo poderia ocorrer por qualquer 1 de 
3 diferentes pares de proles {(2,4), (3,3), (4,2)} e determinamos a probabilidade 
somando as probabilidades simples. 

Agora, passemos para o calculo da probabilidade de um evento compartilhado 
- a ocorrencia simultanea de dois eventos simples. Assumimos que o numero de des¬ 
cendentes produzidos na segunda prole e independente do numero de descendentes 
produzidos na primeira. A independence e uma premissa simplificada que e critica 
em muitas analises estatisticas. Quando dizemos que dois eventos sao independentes 
um do outro, significa que o resultado de um nao e afetado pelo do outro. Se dois 
eventos sao independentes um do outro, a probabilidade de que ambos ocorram 
(evento compartilhado) e igual ao produto de suas probabilidades individual. 

P(A n B) = P(A) x P(B) (se A e B sao independentes) (1.3) 

O simbolo n indica a interse^ao de dois eventos independentes - ou seja, am¬ 
bos ocorrendo simultaneamente. Por exemplo, no exemplo do tamanho da prole, 
suponha que um individuo pode produzir 2, 3, 4 descendentes na primeira prole 
e que a chance de cada um desses eventos e de 1/3. Se as mesmas regras se aplicam 
para a produ^ao da segunda prole, a probabilidade de obter um par de proles (2,4) 
e igual a 1/3 x 1/3 = 1/9. Note que este e o mesmo numero obtido ao tratar cada 
um dos diferentes pares de prole como independentes, eventos equiprovaveis. 

Calculo de probabilidades: paineirinhas* e lagartas 

Trata-se de um exemplo simples que incorpora tanto eventos complexos quanto 
compartilhados. Imagine um conjunto de afloramentos rochosos no qual pode- 


* N. de T. No original, milkweeds e o nome dado a herbaceas da familia Apocynaceae, geralmente 
pertencentes ao genero Asclepias. Muitas especies sao invasoras e foram introduzidas no Brasil. Po- 
dem receber muitos nomes populares, como cega-olho, erva-leiteira, mata-rato, flor-borboleta, paina 
de seda e paineirinha. 
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mos encontrar populates de paineirinha, bem como lagartas herbivoras. Duas 
variedades de populates de paineirinha estao presentes: aquelas que evoluiram 
um composto secundario que as tornam resistentes ( R ) aos herbivoros e aquelas 
que nao possuem. Suponha que voce faz o censo de um numero de populates de 
paineirinhas e determina que P(R ) = 0,20. Em outras palavras, 20% das popula¬ 
tes de paineirinha sao resistentes aos herbivoros. Os outros 80% das populates 
remanescentes representam o complemento desse conjunto. O complemento in- 
clui todos os outros elementos do conjunto, que podemos escrever brevemente 
como nao R. Assim 

P{R) = 0,20 P(naoi?) = 1 - P(R) = 0,80 

Similarmente, suponha que a probabilidade de que a lagarta (I) ocorra em 
uma mancha e de 0,7: 

P(C) = 0,7 P(naoC) = 1 - P(C) = 0,30 

A seguir, especificamos as regras ecologicas que determinam a interaqao en- 
tre lagartas e paineirinhas e entao usamos a teoria de probabilidades para de- 
terminar as chances de encontrar lagartas, paineirinhas ou ambas presentes nas 
manchas. As regras sao simples. Primeiramente, todas as paineirinhas e lagartas 
podem dispersar e chegar a todas as manchas de afloramentos rochosos. As po¬ 
pulates de paineirinhas sempre persistem quando as lagartas nao estao presen¬ 
tes, mas, quando presente, somente as populates de paineirinhas resistentes 
persistem. Como antes, assumimos que as paineirinhas e as lagartas colonizam 
inicialmente as manchas de maneira independente umas das outras. 13 

Primeiro, vamos considerar as diferentes combinates de populates resis¬ 
tentes e nao resistentes ocorrendo com e sem herbivoros. Sao dois eventos simul- 
taneos, entao iremos multiplicar probabilidades para gerar os 4 eventos compar- 
tilhados possiveis (Tabela 1.2). Existem algumas coisas importantes a se notar na 
Tabela 1.2. Primeiro, a soma das probabilidades resultantes dos eventos compar- 
tilhados (0,24 + 0,56 + 0,06 + 0,14) = 1,0, e estes 4 eventos compartilhados juntos 
formam um conjunto proprio. Segundo, podemos somar algumas dessas proba¬ 
bilidades para definir novos eventos complexos e tambem para recuperar alguma 
das probabilidades simples subjacentes. Por exemplo, qual a probabilidade de que 
populates de paineirinhas sejam resistentes? Isto pode ser estimado como a pro- 


L 'Muita biologia interessante surge quando a premissa de independence e violada. Por exemplo, 
muitas especies de borboletas e mariposas adultas sao bastante seletivas e buscam manchas com 
plantas hospedeiras apropriadas para depositar seus ovos. Consequentemente, a ocorrencia de 
lagartas pode nao ser independente da planta hospedeira. Em outro exemplo, a presen^a de herbi¬ 
voros aumenta a pressao seletiva para a evolu^ao de resistencia nos hospedeiros. Alem disso, mui¬ 
tas especies de plantas possuem os tao falados defensores quimicos facultativos que sao “ligados” 
somente quando os herbivoros aparecem. Alem disso, a ocorrencia de populates resistentes pode 
nao ser independente da presen^a de herbivoros. Mais a frente, neste capitulo, aprenderemos al- 
guns metodos que incorporam probabilidades nao independentes em nossos calculos de eventos 
complexos. 
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TABELA 1.2 Calculos de probabilidade para eventos compartilhados 


Resultado 


Evento compartilhado 

Calculo da probabilidade 

Paineirinha 

presente? 

Lagarta 

presente? 

Popula^ao suscetivel sem lagarta 

[l-P(R)xl-P(L)] = 

(1,0 - 0,2) x( 1,0 -0,7) = 0,24 

Sim 

Nao 

Popula^ao suscetivel com lagarta 

[1 -P(R)xP(L)] = 

(1,0-0,2) X (0,7) = 0,56 

Nao 

Sim 

Popula<;ao resistente sem lagarta 

[P(R) x 1 -P(L)] = 

(0,2) x( 1,0-0,7) = 0,06 

Sim 

Nao 

Popula^ao resistente com lagarta 

[P(R)xP(L)) = 

(0,2) X (0,7) =0,14 

Sim 

Sim 


A ocorrencia conjunta de eventos independentes e um evento compartilhado e sua probabilidade pode ser 
calculada como o produto das probabilidades dos eventos individuais. Neste exemplo hipotetico, popula¬ 
tes de paineirinhas que sao suscetiveis as lagartas herbivoras ocorrem com probabilidade P(P), e popula¬ 
tes de paineirinhas que sao resistentes as lagartas ocorrem com probabilidade 1 - P(R). A probabilidade 
de que uma mancha de paineirinhas seja colonizada por lagartas e P(L) e a de que uma mancha de paineiri¬ 
nhas nao seja colonizada por lagartas e de 1 - P(L). Os eventos simples sao a ocorrencia de lagartas (L) e de 
populates resistentes de paineirinhas {R). A primeira coluna lista os quatro eventos complexos, definidos 
por populates resistentes ou suscetiveis de paineirinhas e pela presen^a ou ausencia de lagartas. A segunda 
coluna ilustra o calculo da probabilidade do evento complexo. A terceira e quarta colunas indicam o resul¬ 
tado ecologico. Note que as populates de paineirinhas sao extintas se forem suscetiveis e colonizadas por 
lagartas. A probabilidade de que evento ocorra e de 0,56, deste modo esperamos esse resultado 56% das 
vezes. O resultado mais improvavel e uma popula^ao de paineirinhas resistente que nao contenha lagartas 
(P = 0,06). Note tambem que os quatro eventos compartilhados formam um conjunto proprio, portanto 
suas probabilidades somam 1,0 (0,24 + 0,56 + 0,06 + 0,14 = 1,0). 


babilidade de encontrar populates resistentes com lagartas (P = 0,14) mais a 
probabilidade de encontrar populates resistentes sem lagartas (P = 0,06). A soma 
(0,20) de fato condiz com a probabilidade original de resistencia [ P{R ) = 0,20]. A 
independence dos dois eventos garante que podemos recuperar os valores origi¬ 
nal desta forma. 

Todavia, tambem aprendemos algo novo com esse exercicio. As paineiri¬ 
nhas irao desaparecer se uma popula^ao suscetivel for colonizada por lagartas, 
e isso pode ocorrer a uma probabilidade de 0,56. O complemento deste even¬ 
to, (1- 0,56) = 0,44, e a probabilidade de que um local ira conter uma popula^ao 
de paineirinhas. Equivalentemente, a probabilidade de persistence das paineiri¬ 
nhas pode ser calculada como P(paineirinha presente) = 0,24 + 0,06 + 0,14 = 0,44, 
somando as probabilidades das diferentes combina^oes que resultam na presen^a 
de paineirinhas. Assim, apesar da probabilidade de resistencia ser de apenas 0,20, 
esperamos encontrar populates de paineirinhas em 44% das manchas amostra- 
das, porque nem todas as popula 9 oes suscetiveis sao atingidas por lagartas. Nova- 
mente, enfatizamos que tais calculos sao corretos apenas se os eventos iniciais de 
coloniza^ao forem independentes um do outro. 
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Eventos complexos e compartilhados: regras combinatorias de conjuntos 

Muitos eventos nao sao independentes uns dos outros. Nao obstante, preci- 
samos de metodos para levar em conta a falta de independence. Retornando 
ao exemplo do besouro girinideo, como seria se o numero de descendentes da 
segunda prole de alguma forma fosse relacionado ao produzido na primeira 
prole? Isso pode ocorrer porque organismos possuem uma quantidade limita- 
da de energia disponivel para produzir descendentes, de forma que a energia 
investida na primeira prole nao esta disponivel para investimento na segunda 
prole. Isso afetaria nossa estimativa da probabilidade de produzir 6 descenden¬ 
tes? Antes que possamos responder, precisamos de mais ferramentas em nossa 
caixa de ferramentas probabilisticas. Essas ferramentas nos informam como 
combinar eventos ou conjuntos e nos permite calcular as probabilidades de 
eventos combinatorios. 

Suponha que em nosso espa^o amostral existem dois eventos identificaveis, e 
que cada um consiste de um grupo resultados. Por exemplo, no espa<;o amostral 
Aptidao, poderiamos descrever um evento consistindo em um besouro que pro- 
duz exatamente 2 descendentes em sua primeira prole. Iremos chamar esse evento 
de primeira prole 2, e abreviar como F. O segundo evento e um besouro que pro- 
duz exatamente 4 descendentes na segunda prole. Chamaremos de segunda prole 
4 e abreviaremos como S: 

Aptidao = {(2,2), (2,3), (2,4), (3,2), (3,3), (3,4), (4,2), (4,3), (4,4)} 

F ={(2,2), (2,3), (2,4)} 

S ={(2,4), (3,4), (4,4)} 

Podemos construir dois novos conjuntos a partir de F e S. O primeiro e o novo 
conjunto de resultados, que compreende todos os resultados que fazem parte de F 
ou de S. Indicamos esse novo conjunto usando a nota^aoFuSeo chamamos de 
uniao dos dois conjuntos. 

FkjS ={(2,2), (2,3), (2,4), (3,4), (4,4)} 

Note que o resultado (2,4) ocorre em ambos, Fe S, mas e contado apenas uma 
vez em Fu S. Note, tambem, que a uniao de F e S e um conjunto que contem mais 
elementos que F e S possuem individualmente, pois esses conjuntos sao “adicio- 
nados” para criar a uniao. 

O segundo novo conjunto e composto pelos resultados que estao em F e S. 
Indicamos esse conjunto com a nota^ao FnSeo chamamos de interse^ao de 
dois conjuntos. 

FnS={(2,4)} 

Note que a interse^ao entre F e Se um conjunto que contem menos elemen¬ 
tos, os quais estao contidos apenas em F ou S, pois agora estamos considerando 
apenas os elementos que sao comuns a ambos os conjuntos. O diagrama de Venn, 
na Figura 1.3, ilustra estas operates de uniao e interse^ao. 
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Figura 1.3 Diagrama de Venn ilustrando unioes e interse^oes de conjuntos. Cada anel represen- 
ta um conjunto diferente do numero de descendentes produzidos por urn par de proles de uma 
especie hipotetica do besouro girinfdeo, como na Figura 1.2.0 anel maior representa o conjunto 
Aptidao, que compreende todos os resultados reprodutivos possfveis do besouro. 0 anel menor F 
e o conjunto de todos os pares de proles com exatamente dois descendentes na primeira prole. 0 
anel menor 5 e o conjunto de todos os pares de proles com exatamente 4 descendentes na segunda 
prole. A area na qual os aneis se sobrepoem representa a interse^ao entre F e S (F n S) e contem 
os elementos comuns a ambos. 0 anel que compreende F e S representa a uniao entre FeS(F u 
S) e contem todos os elementos de ambos os conjuntos. Note que a uniao de F e S nao duplica o 
elemento em comum (2,4). Em outras palavras, a uniao de dois conjuntos e a soma dos elementos 
de ambos, menos seus elementos em comum. Assim, (F u S) = (F + S) - (F n S). 


Podemos construir um terceiro conjunto util considerando o chamado de 
complemento de F, que e o conjunto dos objetos remanescentes no espa^o amos- 
tral ( Aptidao , nesse exemplo) que nao estao em F: 

F c ={(3,2), (3,3), (3,4), (4,2), (4,3), (4,4)} 

A partir dos Axiomas 1 e 2, voce deveria ver que: 

P(F) + P(F C ) = 1,0 

Em outras palavras, como F e F c coletivamente incluem todos os resultados 
possiveis (por defini^ao, eles compreendem o conjunto inteiro), a soma das pro- 
babilidades associadas a eles deve resultar em 1,0. 

Por fim, precisamos apresentar o conjunto vazio. Ele nao contem elementos 
e e escrito como {0}. Por que esse conjunto e importante? Considere o conjunto 
que consiste da interse<;ao entre F e F c . Como nao possuem nenhum elemento em 
comum, se nao tivessemos um conjunto vazio, entao FnEseria indefinido. Um 
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conjunto vazio permite que os conjuntos sejam fechados' 4 sob as tres operates 
permitidas: uniao, interse^ao e complemento. 

Calculando a probabilidade de eventos combinatCrios o Axioma 2 declara que 
a probabilidade de um evento complexo e igual a soma das probabilidades dos re- 
sultados que compreendem um evento. Esta pode ser uma opera^ao simples; por- 
tanto, para calcular a probabilidade, digamos,FuScomo P{F ) + P{S). Como F e 
S possuem 3 resultados cada, com probabilidade de 1/9, a soma simples resulta em 
6/9. Contudo, existem apenas 5 elementos emFuS, entao a probabilidade deve ser 
somente de 5/9. Por que o axioma nao funciona? A Figura 1.3 mostra que esses dois 
conjuntos possuem o resultado (2,4) em comum. Nao e uma coincidencia que este 
total seja igual a interse^ao entre FeS.O calculo simples da uniao desses dois con¬ 
juntos resultou na contagem dupla do elemento em comum. Em geral, precisamos 
evitar a contagem dupla quando calculamos a probabilidade em uma uniao. " 

Portanto, calculamos a probabilidade de uma uniao de quaisquer 2 conjuntos 
ou eventos A e B como: 

P(A u 5) = P(A) + P(B) - P(A n B) (1.4) 


" Fechamento e uma propriedade matematica. Uma cole^ao de objetos G (um grupo, tecnicamente) 
e fechada sob uma opera^ao ® (como uma uniao, uma interse^ao ou um complemento) se, para 
todos os elementos Ae BdeG, A® B tambem seja um elemento de G. 

Determinar se um evento foi contado duas vezes ou nao pode ser complicado. Por exemplo, em 
genetica basica de populates, a familiar equacao de Hardy-Weinberg fornece as frequences de di- 
ferentes genotipos em uma populaqao com acasalamentos aleatorios. Para um unico gene, sistema 
de dois alelos, a equacao de Hardy-Weinberg prediz a frequencia de cada genotipo (RR, Rr e rr) em 
uma populacao na qual pea frequencia inicial do alelo Re qe a frequencia inicial do alelo r. Como 
os genotipos R e r formam um conjunto fechado, p + q - 1,0. Cada parente contribui com um uni¬ 
co alelo em seus gametas, de forma que a formacao de descendentes e um evento compartilhado, 
com dois gametas se combinando na fertiliza(;ao e contribuindo com seus alelos para determinar o 
genotipo dos descendentes. A equacao de Hardy-Weinberg prediz a probabilidade (ou frequencia) 
das diferentes combinaqoes de genotipos dos descendentes em uma populacao com acasalamentos 
aleatorios como 

P(RR)=p 2 
P(Rr) = 2pq 
P(rr) = q 

A produ^ao de um genotipo RR requer que ambos os gametas contenham o alelo R. Como a 
frequencia do alelo R na populacao ep,a probabilidade desse evento complexo = pxp = p 2 . Entao, 
por que o genotipo heterozigoto (Rr) ocorre a uma frequencia de 2 pq e nao de apenas pq ? Nao e um 
caso de contagem dupla? A resposta e “nao”, pois ha duas formas de criar um individuo heterozigoto: 
podemos combinar o gameta R de um macho com o r de uma femea, ou combinar o r de um macho 
com o R de uma femea. Esses dois eventos sao distintos, mesmo que o zigoto resultante tenha o mes- 
mo genotipo (Rr) em ambos os casos. Portanto, a probabilidade da formacao de um heterozigoto e 
um evento complexo, cujos elementos sao dois eventos compartilhados: 

P(Rr) = P (macho R e femea r) ou P(macho r e femea R) 

P(Rr) =pq + qp = 2 pq 
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A probabilidade de uma interse^ao e a mesma de ambos os eventos ocorre- 
rem. No exemplo mostrado na Figura 1.3, FnS = {(2,4)}, cuja probabilidade e 
1/9, o produto das de F e de S. ((1/3) x (1/3) = 1/9). Assim, a subtra<;ao de 1/9 
menos 6/9 resulta na probabilidade desejada de 5/9 para P(F u S). 

Se nao houver sobreposi^ao entre A e B, entao eles sao eventos mutuamente 
exclusivos, significando a falta de resultados em comum. A interse^ao de dois 
eventos mutuamente exclusivos (A n B ) e, por consequencia, o conjunto vazio 
{0}. Como este nao possui nenhum resultado e tern probabilidade = 0, podemos 
simplesmente somar as probabilidades de dois eventos mutuamente exclusivos 
para obter a de sua uniao: 

P(A u B) = P{A) + P(B) (seA n£ = {0}) (1.5) 

Agora estamos prontos para retornar a questao de estimar a probabili¬ 
dade de um besouro girinideo de manchas cor de laranja produzir 6 descen- 
dentes, caso o numero de descendentes produzidos na segunda prole dependa 
do numero de descendentes da primeira. Relembre que o evento complexo 6 
descendentes consiste de tres resultados (2,4), (3,4), (4,2); sua probabilidade e 
P(6 descendentes) = 3/9 (ou 1/3). Caso observe que a primeira prole teve dois 
descendentes, qual e a probabilidade de o besouro produzir 4 descendentes na 
proxima (totalizando 6)? Intuitivamente, parece que essa probabilidade tam- 
bem deveria ser de 1/3, pois ha 3 resultados em F e somente um deles (2,4) re¬ 
sulta em 6 descendentes ao total. Esta e a resposta correta. Mas por que a proba¬ 
bilidade nao e igual a 1/9, que e a de obter um (2,4) dentro do conjunto Aptitao ? 
A resposta rapida e que a informa<;ao adicional de saber o tamanho da primeira 
prole influencia a probabilidade do resultado reprodutivo total. Probabilidades 
condicionais resolvem o enigma. 

Probabilidades condicionais 

Se estivermos calculando a probabilidade de um evento complexo e tivermos 
informa^ao sobre um resultado daquele evento, por consequencia devemos 
modificar as estimativas das probabilidades dos outros resultados. As estima- 
tivas atualizadas sao chamadas probabilidades condicionais e as escrevemos 
como: 

P{A | B) 

ou a probabilidade do evento ou resultado A dado o evento ou resultado B. 
A barra vertical ( | ) indica que a probabilidade de A e calculada assumindo 
que o evento ou resultado B ja ocorreu. A probabilidade condicional e defmida 
como: 


P(A\B) = 


PjAnB ) 
P(B) 


( 1 . 6 ) 
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Tal defininao deveria fazer sentido intuitivo. Se o resultado B ja ocorreu, en- 
tao qualquer resultado no espa^o amostral original nao contido em B (i.e., B‘) 
nao pode ocorrer, motivo pelo qual restringimos os resultados de A que pode- 
riamos observar aqueles que tambem ocorrem em B. Assim, P(A \ B) deve, de 
alguma forma, estar relacionado a P(A n B) e a defmimos como sendo propor- 
cional aquela interse^ao. O denominador P(B) e o espano amostral de even- 
tos restringidos para os quais B ja ocorreu. No exemplo do besouro girinideo, 
P(F n S) = 1/9, e P(F) = 1/3, dividindo o primeiro pelo ultimo obtivemos o valor 
para P(F \ S ) = (l/9)/( 1/3) = 1/3, como o sugerido intuitivamente. 

Rearranjando a formula da Equa^ao 1.6 para calcular a probabilidade con- 
dicional, obtemos uma formula geral para calcular a probabilidade de uma 
interse^ao: 

P(A n B) = P(A | B) x P(B) = P(B \ A) x P(A) (1.7) 


Voce deveria relembrar que anteriormente, neste capitulo, defmimos a 
probabilidade da interse^ao de dois eventos independentes como sendo igual 
a P(A) x P(B). Este e um caso especial da formula para calcular a probabili¬ 
dade de interse^ao usando a probabilidade P(A \ B). Simplesmente note que, 
se dois eventos, A e B, sao independentes, entao P(A | B) = P(A), desta forma 
P(A | B) x P(B) = P(A) x P(B). Pela mesma razao, P(A n B) | A) x P(A). 

TEOREMADE BAYES 

Ate agora discutimos probabilidades usando o que e conhecido como paradig- 
ma frequentista, no qual as probabilidades sao estimadas como as frequencias 
relativas dos resultados, baseadas em um conjunto de observances infinitamente 
grande. Cada vez que cientistas desejam estimar a probabilidade de um feno- 
meno, come^am assumindo a falta de conhecimento previo sobre a probabi¬ 
lidade de um evento, e re-estimam a probabilidade com base em um grande 
numero de observances. Em contraste, o paradigma bayesiano, fundamentado 
em uma formula para probabilidades condicionais desenvolvida por Thomas 
Bayes, 16 se estrutura na ideia de que os investigadores podem ja possuir palpites 
das probabilidades de um evento, antes que as observances sejam conduzidas. 



16 Thomas Bayes (1702-1761) foi um ministro nao conformista da Capela 
Presbiteriana em Tunbridge Wells, sul de Londres, Inglaterra. Ele e mais co¬ 
nhecido por seu “ Essay towards solving a problem in the doctrine of chances 
publicado dois anos apos sua morte no Philosophical Transactions 53:370-418 
(1763). Bayes foi eleito membro da Sociedade Real de Londres (Royal Society 
of London) em 1742. Apesar de ser citado por suas contribui^oes a matemati- 
ca, ele nunca publicou um artigo sobre a materia em sua vida. 


Thomas Bayes 
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Tais probabilidades a priori podem ser baseadas em experiencia previa (que 
pode ser uma do tipo frequentista, estimada em estudos anteriores), intuinao ou 
predi^oes de modelos. Essas sao entao modificadas pelos dados das observances 
atuais para produzir probabilidades a posteriori (discutidas em mais detalhes 
no Capitulo 5). Contudo, mesmo no paradigma bayesiano, estimativas quanti- 
tativas de probabilidades a priori devem vir fundamentalmente de observances 
e experimentos. 

A formula de Bayes para calcular probabilidades condicionais, agora conheci- 
da como Teorema de Bayes, e: 

P(B\A)P(A) (18) 

P(B | A)P(A) +P(B | A c )P{A C ) 



Tal formula e obtida por substituinao simples. A partir da Equanao 1.6, po- 
demos escrever a probabilidade condicional P(A \ B) no lado direito da equanao 
como: 


P(A | B) = 


P(AnB) 

P(B) 


A partir da Equanao 1.7, o numerador dessa segunda equanao pode ser re-es- 
crito como P{B | A) x P(A), produzindo o numerador do Teorema de Bayes. Pelo 
Axioma 1, o denominador,P(B), pode ser re-escrito como P(BnA) + P(B nA‘), 
pois esses dois termos se igualam a P(B). Novamente, usando a formula para a 
probabilidade de uma intersenao (Equanao 1.7), esta soma pode ser re-escrita 
como P(B | A) x P(A) + P(B \ A c ) x P(A C ), que e o denominador do Teorema de 
Bayes. 

Apesar do Teorema de Bayes ser simplesmente uma expansao da defininao de 
probabilidade condicional, ele contem uma ideia muito poderosa: a de que a proba¬ 
bilidade de um evento ou resultado A, condicionado por outro evento B, pode ser 
determinada se voce souber a probabilidade do evento B condicional ao evento A e 
o complemento de A, A 1 (por isso o Teorema de Bayes e frequentemente chamado 
de teorema de probabilidade inversa). Iremos retornar a uma exploranao detalhada 
do Teorema de Bayes e seu uso em inferencia estatistica no Capitulo 5. 

Por enquanto, concluimos destacando a distinnao muito importante entre 
P(A | B ) e P(B | A). Apesar de essas duas probabilidades condicionais parecerem 
similares, elas medem coisas completamente diferentes. Como exemplo, relembre 
o caso das paineirinhas suscetiveis e resistentes e das lagartas. 

Primeiro, considere a probabilidade condicional: 

P(L | R) 

Esta expressao indica a probabilidade de lagartas (I) serem encontradas dada 
a resistencia de uma populanao de paineirinhas ( R ). Para estimar P(L \ R), precisa- 
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mos examinar uma amostra aleatoria de populates de paineirinhas resistentes e 
determinar a frequencia com que estas populates possuem lagartas. Agora, con- 
sidere a probabilidade condicional: 

P(R | L) 

Em contraste a expressao anterior, P(R \ L) e a probabilidade de que uma 
popula<;ao de paineirinhas seja resistente (R), dado que ela esteja sendo consumi- 
da por lagartas (I). Para estimar P(R | I), precisariamos examinar uma amostra 
aleatoria de lagartas e determinar a frequencia com a qual elas estavam de fato se 
alimentando em populates de paineirinhas resistentes. 

Essas sao duas quantidades bastante diferentes e suas probabilidades sao 
determinadas por diferentes fatores. A primeira probabilidade condicional 
P(L | R) (a probabilidade da ocorrencia de lagartas em razao da resistencia das 
paineirinhas) ira depender, entre outras coisas, da extensao a que resistencia 
a herbivora e direta ou indiretamente responsavel pela ocorrencia de lagartas. 
Em contraste, a segunda probabilidade condicional P(R \ L) (a probabilidade 
de resistencia de populates de paineirinhas em razao da presen^a de lagartas) 
ira depender, em parte, da incidencia de lagartas em plantas resistentes versus 
outras situates que poderiam resultar na presen^a de lagartas (p. ex., lagartas 
se alimentando em outras especies de plantas ou plantas suscetiveis que ainda 
nao morreram). 

Por fim, perceba que probabilidades condicionais se distinguem das simples: 
P(L ) e somente a probabilidade de que um individuo escolhido de maneira alea¬ 
toria seja uma lagarta, e P{R) e a probabilidade de que uma paineirinha escolhida 
ao acaso seja resistente a lagartas. No Capitulo 5, veremos como usar o Teorema 
de Bayes para calcular probabilidades condicionais quando nao podemos medir 
diretamente P(A \B). 


RESUMO 


A probabilidade de um resultado e apenas o numero de vezes que um resultado 
ocorre dividido pelo total de observances. Se probabilidades simples sao conheci- 
das ou estimadas, as de eventos complexos (Evento A ou Evento B ) podem ser de¬ 
terminadas por meio da soma; probabilidades de eventos compartilhados (Evento 
A e Evento B) podem ser determinadas por meio da multiplica<;ao. A defini<;ao de 
probabilidade, juntamente aos axiomas de aditividade de probabilidades e as tres 
operates com conjuntos (uniao, interse<;ao e complemento), forma os funda- 
mentos do calculo de probabilidades. 



2 

Variaveis Aleatorias e 
Distribuigoes de 
Probabilidades 


N o Capitulo 1 exploramos a no<,ao de probabilidade e a ideia de que o re- 
sultado de uma unica observagao £ um evento incerto. Contudo, quando 
acumulamos dados de muitas observances, come^'amos a ver padroes regulares 
na frequencia de distribut'ao dos eventos (p.ex., Figura 1.1). Neste capitulo ex- 
ploraremos algumas fundees matematicas uteis que podem gerar tais distribui- 
noes de frequencia. 

Certas distributees de probabilidade sao assumidas por muitos metodos es- 
tatisticos. Por exemplo, a analise de variancia parametrica (ANOVA, ver Capitulo 
10) assume que os valores medidos em amostras aleatorias se ajustam a distribui- 
nao normal, ou distribut'ao com “forma de sino”, e que a variancia da distribut'ao 
seja similar entre os diferentes grupos. Se os dados se ajustam a estas premissas, a 
ANOVA pode ser utilizada para testar diferen^as entre as medias de grupos. Dis¬ 
tributees de probabilidade tambem podem ser utilizadas para construir modelos 
e fazer predin'oes. Por fim, distributees de probabilidade podem se ajustar a con- 
juntos de dados reais sem que se especifique um modelo mecanistico em particu¬ 
lar. Usamos distributees de probabilidades porque elas funcionam - ajustam-se 
a muitos dados no mundo real. 

Nossa primeira incursao na teoria de probabilidades envolveu a estimativa 
da probabilidade de resultados individual, como a captura de presas por plan- 
tas jarro ou a reprodun'ao de besouros carapeta. Encontramos valores numericos 
para cada uma dessas probabilidades usando regras simples, ou fundees. Mais 
formalmente, a regra matematica (ou fun^ao) que atribui um dado valor nume- 
rico a cada resultado possivel de um experimento no espa^o amostral de interesse 
£ chamada de variavel aleatoria. Usamos o termo “variavel aleatoria” no sentido 
matematico, nao no sentido coloquial de um evento aleatbrio. 

Surgem em duas formas: variAveis aleatorias discretas e variaveis aleato¬ 
rias continuas. A primeira tern valores finitos ou contdveis (como os mimeros 
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inteiros; ver a nota de rodape 4, Capitulo 1). Exemplos comuns incluem presen^a 
ou ausencia de uma dada especie (que recebe os valores de 0 ou 1), ou o numero 
de descendentes, de folhas ou de pernas (valores inteiros). O segundo tipo, por 
outro lado, pode assumir qualquer valor dentro de um intervalo regular. Exem¬ 
plos incluem a biomassa de um estorninho, a area da folha consumida por um 
herbivoro ou o conteudo de oxigenio dissolvido em uma amostra de agua. Por 
um lado, todos os valores de uma variavel continua que medimos no mundo real 
sao discretos: nossa instrumental© apenas permite medirmos coisas a um nivel 
finito de precisao. 1 2 Mas nao ha um limite teorico a precisao que podemos obter na 
medi^ao de uma variavel continua. No Capitulo 7 retornaremos a distin<;ao entre 
as variaveis discreta e continua como uma considera^ao-chave para os delinea- 
mentos de experimentos de campo e amostral. 

VARIAVEIS ALEATORIAS DISCRETAS 
Variaveis aleatorias de Bernoulli 

O experimento mais simples possui apenas dois resultados, como a presen^a ou 
ausencia de organismos, moedas cairem em cara ou coroa, ou besouros se re- 
produzirem ou nao. Uma variavel aleatoria que descreve o resultado de tal expe¬ 
rimento e a de Bernoulli; um experimento com observances independentes no 
qual ha apenas dois resultados possiveis para cada observanao e uma tentativa de 
Bernoulli.' Usamos a nota<;ao: 


1 E importante entender a distin^ao entre precisao e acuracia em medidas. A acuracia se refere a quao 
proximo a medida esta do seu valor real. Medidas acuradas sao destendenciadas, indicando que elas 
nao estao consistentemente nem abaixo nem acima do valor real. A precisao se refere a concordance 
entre uma serie de medidas e ao grau com que essas medidas podem ser discriminadas. Por exemplo, 
uma medida pode ser precisa em 3 casas decimais, indicando que podemos discriminar as medidas 
apos as 3 casas decimais. A acuracia e mais importante que a precisao. Seria muito melhor usar uma 
balan^a acurada que foi precisa em somente uma casa decimal que uma inacurada que foi precisa 
a cinco casas decimais. As casas decimais extras nao lhe trazem mais proximo do valor real se seu 
instrumento e imperfeito ou tendencioso. 

‘ Jacob (vulgo Jaques ou James) Bernoulli (1654-1705) pertenceu a uma fa- 
milia famosa de fisicos e matematicos. Ele e seu irmao Johann sao conside- 
rados atras apenas de Newton em seu desenvolvimento do calculo, mas ar- 
guiam constantemente acerca dos meritos relativos do trabalho um do outro. 
O maior trabalho matematico de Jacob, Ars conjectandi (publicado em 1713, 
8 anos apos sua morte), foi o primeiro grande texto sobre probabilidade. Ele 
incluiu a primeira exposi^ao de muitos dos topicos discutidos nos Capitulos 

2 e 3, como teorias gerais de permutacoes e combinai^oes, as primeiras provas 
do teorema binomial e a Lei dos Grandes Numeros. Jacob Bernoulli tambem 
fez contributes substanciais a astronomia e a mecanica (fisica). 
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X ~ Bernoulli(p) (2.1) 

para indicar que a variavel X e uma de Bernoulli. O simbolo ~ e lido como “e 
distribuxdo como”. Assim, X assume os valores do numero de “sucessos” na ob- 
serva^ao (p. ex., presente, capturado, reproduziu), e p e a probabilidade de um 
resultado de sucesso. O exemplo mais comum de uma tentativa de Bernoulli e o 
arremesso de uma unica moeda honesta (talvez nao do Euro belga; ver a nota de 
rodape 7, Capitulo 1, e o Capitulo 11), no qual a probabilidade de resultar cara = 
a probabilidade de dar coroa = 0,5. Contudo, mesmo uma variavel com um gran¬ 
de numero de resultados pode ser redefinida como uma tentativa de Bernoulli 
se for possivel colapsar a amplitude de respostas a dois resultados. Por exemplo, 
um conjunto de 10 eventos reprodutivos do besouro carapeta pode ser analisado 
como uma unica tentativa de Bernoulli, caso em que o sucesso e definido como 
resultando de exatamente 6 descendentes e o insucesso, como resultando com mais 
ou menos de 6 descendentes. 

Exemplo de uma tentativa de Bernoulli 

O censo de uma especie de planta rara, Rhexia mariana ( meadow beauty), em 
todos os municipios de Massachusetts fornece um exemplo de Tentativa de Ber¬ 
noulli. A ocorrencia de Rhexia e uma variavel aleatoria de Bernoulli X, que assume 
os valores de dois resultados: X - 1 ( Rhexia presente) ou X - 2 ( Rhexia ausente). 
Existem 349 municipios em Massachusetts, portanto, essa Tentativa de Bernoulli 
e a busca em todos esses municipios pela ocorrencia de Rhexia. Devido ao fato 
de a planta ser rara, imagine que a probabilidade de que a Rhexia esteja presente 
(i.e., X- 1) ebaixa: P(X = 1) = p = 0,02.Assim,sefizermosocenso em apenasum 
municipio, existem apenas 2% de chance ( p - 0,02) de encontrar a Rhexia. Mas 
qual e a probabilidade esperada para que a Rhexia ocorra em 10 municipios, e nao 
nos 339 municipios remanescentes? 

Devido a probabilidade de a Rhexia estar presente em qualquer municipio 
ser p — 0,02, sabemos pelo Primeiro Axioma da Probabilidade (Capitulo 1) que a 
probabilidade da Rhexia estar ausente em qualquer municipio e = (1 - p) - 0,98. 
Por defini<;ao, cada evento (ocorrencia em um municipio) nesta Tentativa de Ber¬ 
noulli deve ser independente. Para tanto, assumimos que a presen^a ou ausen- 
cia de Rhexia em um dado municipio independe em qualquer outro. Visto que 
a probabilidade de a Rhexia estar presente em um municipio e de 0,02 e a de 
que ocorra em outro e a mesma, a probabilidade que ela ocorra nesses dois mu¬ 
nicipios especificos e de 0,02 x 0,02 = 0,0004. Por extensao, a probabilidade de 
que a Rhexia ocorra em 10 municipios especificos e de 0,02 10 = 1,024 x 10 !/ (ou 
0,00000000000000001024, que e um numero muito pequeno). 

Contudo, este calculo nao nos da a exata resposta que estamos buscando. Mais 
precisamente, queremos a probabilidade de que a Rhexia ocorra em exatamente 
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10 muniripios e que nao ocorra nos demais 339. Imagine que o primeiro munici- 
pio pesquisado nao contenha Rhexia, o que deveria acontecer a uma probabilida- 
de de (1 -p) = 0,98. O segundo munidpio contem Rhexia, o que deveria aconte¬ 
cer a uma probabilidade dep = 0,02. Como a presen<;a ou a ausencia de Rhexia em 
cada munidpio e independente, a probabilidade de ter um munidpio com Rhexia 
e outro sem, apos escolher dois municipios ao acaso, deve ser o produto de p e 
(1 -p) = 0,02 x 0,98 = 0,0196 (ver Capitulo 1). Por extensao, consequentemente, 
a probabilidade de a Rhexia ocorrer em um dado conjunto de 10 municipios em 
Massachusetts deve ser (0,02 10 ) multiplicada pela de que a Rhexia nao ocorra em 
nenhum dos outros 339 municipios (0,98 " 9 ) = 1,11 x 10 20 . Mais uma vez, este e 
um numero muito pequeno. 

Porem, nosso calculo, ate agora, nos da apenas a probabilidade de que a Rhe¬ 
xia ocorra em exatamente 10 municipios em particular (e em nenhum outro). 
Mas estamos de fato interessados na probabilidade de que a Rhexia ocorra em 
quaisquer 10 municipios de Massachusetts, nao em uma lista especifica de 10 mu¬ 
nicipios. A partir do Segundo Axioma da Probabilidade (Capitulo 1) aprendemos 
que as probabilidades de eventos complexos que ocorrem por diferentes vias po- 
dem ser calculadas somando-se as probabilidades de cada uma das vias. Desta for¬ 
ma, quantos conjuntos diferentes, com 10 municipios cada, sao possiveis em uma 
lista de 349? Muitos! De fato, sao possiveis 6,5 x 10 ls diferentes combina^oes de 
10 com um conjunto de 349 (explicaremos este calculo na proxima sessao). Por- 
tanto, a probabilidade de a Rhexia ocorrer em quaisquer 10 municipios e igual a 
de que ela ocorra em um conjunto de 10 municipios (0,02 10 ) multiplicada pela de 
que ela nao ocorra nos 339 municipios remanescentes (0,98 339 ) multiplicada pelo 
numero de combina^oes unicas que podem ser produzidas com um conjunto de 
349 municipios (6,5 x 10 ls ). Neste produto final = 0,07, ha uma chance de 7% de 
encontrar exatamente 10 municipios com Rhexia. Este tambem e um numero pe¬ 
queno, mas nao tao reduzido quanto os dois primeiros valores de probabilidade 
que haviamos calculado. 

Muitas tentativas de Bernoulli = uma variavel aleatoria binomial 

Como uma caracteristica central da ciencia e a replica<;ao, raras vezes iremos con- 
duzir apenas uma tentativa de Bernoulli. Pelo contrario, conduziriamos replicas 
independentes de tentativas de Bernoulli em um unico experimento. Defmimos 
uma variavel aleatoria binomial X como sendo o numero de resultados de su- 
cesso em n tentativas de Bernoulli independentes. A nota^ao para uma variavel 
aleatoria binomial e: 


X~Bin (n,p) (2.2) 

para indicar a probabilidade de obter X resultados de sucesso em n tentativas de 
Bernoulli, onde a probabilidade de um resultado de sucesso em qualquer evento e 
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p. Note que sen - 1, a variavel aleatoria binomial X e equivalente a uma variavel 
aleatoria de Bernoulli. Uma variavel aleatoria binomial e um dos tipos mais co- 
muns de variaveis aleatorias encontradas em estudos ambientais e de ecologia. A 
probabilidade de obter X sucessos para uma variavel aleatoria binomial e: 


P(X) = 


n\ 

X!(n-X)! 


p x a-pr x 


(2.3) 


onde neo numero de tentativas,Xeo numero deresultados de sucesso (X< n), e 
n! significa n fatorial, 3 assim calculado: 

n x («-l) x (n- 2) x ... x (3) x (2) x (1) 

A Equa^ao 2.3 tern tres componentes, dos quais dois deles parecem familiares 
a nossa analise do problema que envolve a Rhexia. O componente pea pro¬ 
babilidade de obter X sucessos independentes, cada um com probabilidade p. O 
componente (1 - p) (nXI e a probabilidade de obter (n - X) insucessos, cada um 
a uma probabilidade de (1 - p). Note que a soma de sucessos (X) e o numero de 
insucessos (n -X) e n, o numero total de tentativas de Bernoulli. Como vimos no 
exemplo da Rhexia, a probabilidade de obter X sucessos com probabilidade p e 
(n - X) insucessos com probabilidade de (1 - p) e o produto desses dois eventos 
independentes p x ( 1 - p) < "” X) . 

Entao por que precisamos do termo: 

n\ 

X!(h-X)! 

e de onde ele vem? A nota^ao equivalente para esse termo e: 

V 

(le-se “« sobre X”), e e conhecida como coeficiente binomial. O coeficiente bino¬ 
mial e necessario porque ha mais de uma via para obter a maioria das combina- 
^oes de sucessos e insucessos (as combina<;6es de 10 municipios que descrevemos 
no exemplo anterior). Por exemplo, o resultado um sucesso em um conjunto de 
duas tentativas de Bernoulli pode, na verdade, ocorrer de duas formas: (1, 0) ou 
(0,1). Dessa forma, a probabilidade de obter um sucesso em um conjunto de duas 
tentativas de Bernoulli e igual a probabilidade de obter um resultado com um 
sucesso [= p( 1 — p)] vezes o numero de resultados possiveis com um sucesso (= 2). 
Poderiamos escrever todos os resultados diferentes com X sucessos e conta-los, 


3 A opera^ao de fatorial pode ser aplicada somente a numeros inteiros nao negativos. Por defini- 
9*0, 0! = 1. 
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mas conforme o n fica grande, o X tambem fica; existem 2" resultados possiveis 
para n tentativas. 

Seria mais simples computar diretamente o numero de resultados de X (suces- 
sos), e isso e o que o coeficiente binomial faz. Retornando ao exemplo da Rhexia, 
temos 10 ocorrencias dessa planta (X = 10) e 349 municipios ( n - 349), porem nao 
sabemos em quais municipios em particular ocorre. No comedo de nossa busca, 
existiam inicialmente 349 municipios nos quais a Rhexia podia ocorrer. Uma vez 
que uma Rhexia seja encontrada em um dado municipio, em apenas outros 348 ela 
pode ocorrer. Assim, existem 349 combina^oes de municipios nas quais poderia ha¬ 
ver apenas uma ocorrencia e 348 combina^oes nas quais poderia haver uma segun- 
da ocorrencia. Por extensao, para X ocorrencias, o numero total de vias pelas quais 
as 10 ocorrencias da Rhexia podem estar distribuidas nos 349 municipios deve ser 

349 x 348 x 347 x 346 x 345 x 344 x 343 x 342 x 341 x 340 = 2,35 x 10 25 

Em geral, o numero total de formas para obter X sucessos em n tentativas e: 
nx (n - l)x (n-2)x ...x(n-X + 1) 

o que parece muito com a formula do «!. Os termos na equa^ao acima que faltam 
em n\ sao todos os que vem apos (n-X+ 1),ou 

(n-X) x (n-X- 1) x (n-X -2) x ... x 1 

que e simplesmente igual a (n -X)!. Assim,se dividirmos n\ por (n-X)!, teremos 
o numero total de formas para obter X sucessos em n tentativas. Mas isso nao e 
exatamente o mesmo que o coeficiente binomial descrito acima, que alem disso 
divide o resultado por X!: 

n\ 

(n — X)\X\ 

A razao para esta divisao adicional e que nao queremos contar duas vezes pa- 
droes identicos de sucessos que simplesmente ocorreram em uma ordem diferen- 
te. Retornando a Rhexia, se primeiro encontrarmos populates no municipio de 
Barnstable e depois em Chatham, poderiamos nao querer contar esta forma com 
um resultado diferente em que primeiro encontramos populates em Chatham 
e depois em Barnstable. Pela mesma razao acima, existem exatamente X! formas 
para reordenar um dado resultado. Assim, precisamos “descontar” (dividir por) 
do resultado X!. A utilidade dessas diferentes permuta^oes sera mais aparente no 
Capitulo 5, quando discutirmos os Metodos de Monte Carlo ao testar hipoteses.' 

1 Mais um exemplo para persuadir o leitor de que o coeficiente binomial funciona. Considere o se- 
guinte conjunto de 5 especies de peixes marinhos: 

{(bodiao), (gobio), (Maria-da-toca), (enguia), (peixe-donzela)} 

Quantos pares unicos de peixes podem ser formados? Se listarmos todos, encontramos 10: 

(bodiao), (Maria-da-toca) 

(bodiao), (gobio) 

(bodiao), (enguia) ( Continua ) 





Princi'pios de Estati'stica em Ecologia 51 


A distribui^ao binomial 

Agora que temos uma fun^ao simples para calcular a probabilidade de uma va¬ 
riavel aleatoria binomial, que faremos com ela? No Capitulo 1, apresentamos o 
histograma, um tipo de grafico utilizado para apresentar de maneira concisa o 
numero de observances que resultaram em algo particular. Similarmente, pode- 
mos fazer um grafico do numero de variaveis aleatorias binomiais de uma serie de 
tentativas de Bernoulli que resultaram em cada um dentre as possiveis respostas. 
Tal histograma e chamado de distribuinao binomial e e gerado a partir de uma 
variavel aleatoria binomial (Equanao 2.3). 

Por exemplo, considere a variavel aleatoria de Bernoulli para a qual a probabili¬ 
dade de sucesso = probabilidade de insucesso = 0,5 (como jogar moedas honestas). 
Nosso experimento consistira em jogar uma moeda honesta 25 vezes (n = 25) e nosso 
resultado possivel e dado pelo espa^o amostral do numero de caras = {0,1,..., 24,25}. 
Cada resultado e uma variavel aleatoria binomial e a probabilidade de cada resul¬ 
tado e obtido pela formula binomial, a qual iremos nos referir como fun^ao de dis¬ 
tribuinao de probabilidade, porque ela e a funnao (ou regra) que fornece o valor 
numerico (a probabilidade) de cada resultado dentro do espa^o amostral. 

Usando nossa formula para uma variavel aleatoria binomial, podemos tabular 
as probabilidades de qualquer resultado possivel em 25 buscas por Rhexia (Tabela 
2.1). Podemos representar essa tabela em um histograma (Figura 2.1), que pode 
ser interpretado de duas formas. Primeiro, os valores do eixo-y podem ser vistos 
como a probabilidade de obter uma dada variavel aleatoria X (p. ex., o numero 
de ocorrencias de Rhexia ) em 25 observances, em que a probabilidade de uma 
ocorrencia e de 0,5. Nesta interpretanao, nos referimos a Figura 2.1 como uma 
distribuinao de probabilidade. Por consequencia, se somarmos os valores da 
Tabela 2.1, o resultado e exatamente 1,0 (incluindo o erro de arredondamento), 
pois eles definem o espano amostral inteiro (Primeiro Axioma da Probabilidade). 
Segundo, podemos interpretar os valores do eixo-y como a frequencia relativa es- 
perada para cada variavel aleatoria em um grande numero de experimentos, cada 
um com 25 replicas. Essa defininao de frequencia relativa se equipara a defininao 
formal constante no Capitulo 1. Ela tambem e base do termo frequentista, que 
descreve estatisticas baseadas na frequencia relativa de um evento com base em 
um numero infinitamente grande de tentativas. 


4 (Continua^ao) 

(bodiao), (peixe-donzela) 
(Maria-da-toca), (gobio) 
(Maria-da-toca), (enguia) 
(Maria-da-toca), (peixe-donzela) 
(gobio), (enguia) 

(gobio), (peixe-donzela) 
(enguia), (peixe-donzela) 


Usando o coeficiente binomial, poderiamos usar um n = 5eX = 2e chegar ao mesmo numero: 



120 

6x2 


= 10 
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TABELA 2.1 Probabilidades binomiais para p = 0,5 com 25 tentativas 


Numero de sucessos (X) 

Probabilidade de (X) em 25 tentativas (P(X)) 

0 

0,00000003 

1 

0,00000075 

2 

0,00000894 

3 

0,00006855 

4 

0,00037700 

5 

0,00158340 

6 

0,00527799 

7 

0,01432598 

8 

0,03223345 

9 

0,06088540 

10 

0,09741664 

11 

0,13284087 

12 

0,15498102 

13 

0,15498102 

14 

0,13284087 

15 

0,09741664 

16 

0,06088540 

17 

0,03223345 

18 

0,01432598 

19 

0,00527799 

20 

0,00158340 

21 

0,00037700 

22 

0,00006855 

23 

0,00000894 

24 

0,00000075 

25 

0,00000003 


S = 1,00000000 


A primeira coluna mostra a amplitude total do numero de possiveis sucessos em 25 tentativas (i. e., de 0 a 
25). A segunda da a probabilidade de obter exatamente aquele numero de sucessos, calculada a partir da 
Equa^ao 2.3. Considerando os erros de arredondamento, tais probabilidades somam 1,0 a area total sob a 
curva de probabilidades. Note que um binomio com probabilidade p = 0,5 da uma distribui^ao simetrica 
perfeita de sucessos, centralizada em 12,5, que e a expectativa da distribui^ao (Figura 2.1). 


A Figura 2.1 e simetrica - o lado esquerdo e o lado direito da distribui<;ao 
sao imagens espelho uma da outra/ Contudo, aquele resultado e uma proprieda- 


"Se perguntar a maioria das pessoas quais as chances de obter 12 ou 13 caras em 25 lan^amentos 
de uma moeda honesta, elas irao dizer que e cerca de 50%. Contudo, a probabilidade real de obter 
12 caras e somente de 0,155 (Tabela 2.1), cerca de 15,5%. Por que este numero e tao pequeno? A 
resposta e que a equa^ao binomial da a probabilidade exata: o valor 0,155 e a probabilidade de 

{continua) 







Princi'pios de Estati'stica em Ecologia 53 



X 

Figura 2.1 Distribui^ao de probabilidades para uma variavel aleatoria binomial. Ha apenas 
dois resultados possiveis (p. ex., Sim, Nao ) em uma unica tentativa. A variavel X representa o 
numero de resultados possiveis em 25 tentativas. A variavel P(X) representa a probabilidade de 
obter determinado numero de resultados positivos, calculada a partir da Equa^ao 2.3. Como a 
probabilidade de urn resultado de sucesso foi estipulada em p = 0,5, a distribui^ao binomial e 
simetrica, e o ponto no meio da distribui^ao, 12,5 (ou metade das 25 tentativas). Uma distribuigao 
binomial e especificada por dois parametros: n, o numero de tentativas; e p, a probabilidade de 
obter urn resultado positivo. 


de especial da distribui^ao binomial em que p = (1 - p) = 0,50. Alternativas sao 
possiveis, como com moedas tendenciosas, que caem em cara com uma frequen¬ 
ce superior a 50%. Por exemplo, com um p = 0,80 e 25 tentativas, uma forma di- 
ferente da distribui<,ao binomial e obtida, como na Figura 2.2. Essa distribui^ao 
e assimetrica e deslocada para a direita; amostras com muitos sucessos sao mais 
provdveis do que na Figura 2.1. Assim, a forma exata da distribui^ao binomial 
depende do numero de tentativas (n), e da probabilidade de sucesso, (p). Voce 


' (Continlui^ao) 

obter exatatnente 12 caras - nem mais nem menos. Contudo> cientistas estao firequentemente mais 
interessados em saber a probabilidade extrema ou probabilidade de cauda. Esta refere-se a chance 
de obter 12 ou menos caras em 25 tentativas e e calculada atraves da soma das probabilidades para 
cada resultado de 0 ate 12 caras. Esta soma e de fato 0,50, e corresponde a area da metade esquerda 
da distribui^ao binomial da Figura 2.1. 
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X 

Figura 2.2 Distribui^ao de probabilidades para uma variavel aleatoria binomial X ~ Bin(25,0,8) 
- ou seja, em 25 tentativas e probabilidade de um resultado de sucesso para cada tentativa de 
p = 0,8. Esta figura seque o mesmo esbogo e nota^ao da Figura 2.1. Contudo, nesta, a probabilidade 
de um resultado positivo e p = 0,8 (em vez de p = 0,5), e a distribui^ao nao e mais simetrica. Note 
que a expectativa para esta distribui^ao binomial e 25 x 0,8 = 20, que corresponde a moda (pico 
mais alto) do histograma. 


pode tentar gerar suas proprias distributees binomiais 6 usando valores diferen- 
tes para one para o p. 

Variaveis aleatorias de Poisson 

A distributee) binomial e apropriada para casos em que ha um numero fixo de 
tentativas (n) e a probabilidade de sucesso nao e muito pequena. Contudo, a for¬ 
mula rapidamente se torna comprida e complicada quando o«se torna grande 
e o p pequeno, como a ocorrencia de plantas ou animais raros. Nao obstante, 


(> No Capitulo 1 (ver nota de rodape 7), discutimos um experimento de girar-moedas com a nova 
moeda do Euro, que forneceu uma estimativa de p = 0,56 para n = 250 tentativas. Use planilhas 
ou programas estatisticos para gerar a distribui^ao binomial com esses parametros e compare-a 
a de uma moeda honesta (p = 0,50, n = 250). Voce vera que essas distributes de probabilida¬ 
des de fato diferem, e que a com p = 0,56 e deslocada um pouco para a direita. Agora, fa$a o 
mesmo exercicio com n - 25, como na Figura 2.1. Com um tamanho amostral relativamente 
pequeno, sera virtualmente impossivel distinguir as duas distributes. Em geral, quanto mais 
proximas as expectativas de duas distributes (ver Capitulo 3), maior sera a amostra necessaria 
para distingui-las. 
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a binomial somente e util quando podemos contar diretamente as tentativas. 
Porem, em muitos casos, nao contamos tentativas individuais, mas sim eventos 
que ocorrem em uma amostra. Por exemplo, suponha que as sementes de uma 
orquidea (uma planta de floraqao) sejam dispersas aleatoriamente em uma re- 
giao, e que contemos o numero de sementes dentro de quadrados amostrais de 
tamanho fixo. Nesse caso, a ocorrencia de cada semente representa um resultado 
de sucesso de uma tentativa de dispersao que nao foi observada. No entanto, 
realmente nao podemos dizer quantas tentativas foram necessarias para gerar 
essa distribui^ao. Amostras no tempo tambem podem ser tratadas assim, como 
a contagem do numero de passaros que visitam um alimentador em um periodo 
de 30 minutos. Para tais distributes, usamos a distribui^ao de Poisson, ao in- 
ves da distribui^ao binomial. 

Uma variavel aleatoria de Poisson' Xeo numero de ocorrencias de um even- 
to registrado em uma amostra de area fixa ou durante um intervalo fixo de tem¬ 
po. Variaveis aleatorias de Poisson sao utilizadas quando tais ocorrencias sao raras 
- ou seja, quando o numero mais comum de contagens em uma amostra e 0. A 
variavel aleatoria de Poisson, por si so, e o numero de eventos em cada amostra. 
Como sempre, assumimos que as ocorrencias de cada evento sao independentes 
umas das outras. 

Variaveis aleatorias de Poisson sao descritas por um unico parametro X, al- 
gumas vezes referido como razao de Poisson, pois variaveis aleatorias de Pois¬ 
son podem descrever a frequencia de eventos raros no tempo. O parametro X e 
o valor medio do numero de ocorrencias do evento em cada amostra (ou sobre 
cada intervalo de tempo). Estimativas de X podem ser obtidas pela coleta de 
dados ou do conhecimento previo. A nota^ao para uma variavel aleatoria de 
Poisson e: 



Variaveis aleatorias de Poisson sao nomeadas para Simeon-Denis Poisson 
(1781-1840), que afirmou que “a vida foi boa apenas para duas coisas: para 
fazer matematica e para ensina-la” (fide Boyer, 1968). Ele aplicou de mate¬ 
matica a fisica (em seu trabalho de dois volumes Traite de mecanique , publi- 
cado em 1811 e 1833, e realizou uma primeira deriva^ao da Lei dos Grandes 
Numeros (ver Capitulo 3). Seu tratado em probabilidade, Recherches sur la 
probability des jugements , foi publicado em 1837. 

A mais famosa referenda literaria a distribui^ao de Poisson ocorre no 
romance de Thomas Pynchon O arco-iris da gravidade ( Gravity's rainbow , 
1972*). Um dos personagens principals do romance, Roger Mexico, traba- 
lhava para a The White Visitation em PISCES (Psychological Intelligence Scheme for Expediting Surren¬ 
der) durante a Segunda Guerra Mundial. Ele aponta, em um mapa de Londres, os pontos de ocor¬ 
rencia atingidos por bombas nazistas e ajusta os dados a uma distribui^ao de Poisson. O arco-iris da 
gravidade , que ganhou o premio National Book Award em 1974, contem diversas outras referencias 
a estatistica, matematica e ciencia. Ver Simberloff (1978) para uma discussao da entropia e biofisica 
do romance de Pynchon. 


Simeon-Denis Poisson 


* N. de T. Data da publica^ao do titulo em ingles. Em portugues, o livro foi publicado em 1998, pela 
Editora Companhia das Letras. 
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X ~ Poisson(A,) 

(2.4) 

e calculamos a probabilidade de qualquer observa^ao x como: 

P(x) = ^e~ x 

(2.5) 

x\ 



onde e e uma constante, a base do logaritmo natural (e ~ 2,71828). Por exemplo, 
suponha que o numero medio de plantulas de orquideas encontrado em um qua- 
drado de 1 m 2 e 0,75. Qual e a chance de um unico quadrado conter 4 plantulas? 
Neste caso, X — 0,75 e x = 4. Usando a Equa^ao 2.5, 

0 75 4 

P (4 plantulas) = ’ e~ 0,75 = 0,0062 

Um evento muito mais provavel e um quadrado nao conter nenhuma plantula: 

P (0 plantulas) = ^- e ~°' 75 = 0,4724 

Existe uma rela<;ao intima entre as distributes de Poisson e Binomial. Para 
uma variavel aleatoria binomial X ~ Bin(n, p), na qual o numero de sucessos k 
e muito pequeno em rela<;ao ao tamanho amostral (ou numero de tentativas) 
n, podemos ter uma aproximativa de X usando a distributo de Poisson, e es- 
timando P(X) como Poisson(A,). Contudo, a distributo binomial depende da 
probabilidade de sucesso p e do numero de tentativas n, enquanto a distribui^ao 
de Poisson depende apenas do numero medio de eventos por amostra, X. 

Uma familia inteira de distributes de Poisson e possivel, dependendo do 
valor de X (Figura 2.3). Quando X e pequeno, a distributo forma um forte “J 
invertido” com os eventos mais provaveis sendo de 0 ou 1 ocorrencia por amostra, 
mas com uma longa cauda de probabilidades que se estende a direita e as quais 
correspondem a amostras muito raras com muitos eventos. Conforme X aumen- 
ta, o centro da distributo se desloca para a direita, que se torna mais simetrica, 
assemelhando-se a uma distributo normal ou binomial. As distributes bino¬ 
mial e a de Poisson sao discretas e possuem apenas numeros inteiros, com um va¬ 
lor minimo de 0. Contudo, a distributo binomial sempre e limitada por valores 
entre 0 e n (numero de tentativas). Em contraste, a cauda do lado direito da distri¬ 
buto de Poisson e ilimitada e se estende ao infinito, apesar de as probabilidades 
rapidamente se tornarem muito pequenas para numeros grandes de eventos em 
uma unica amostra. 

Um exemplo de variavel aleatoria de Poisson: distributo de uma planta rara 

Para fechar esta discussao, descrevemos a aplica^ao da distributo de Poisson 
a da planta rara Rhexia mariana em Massachusetts. Os dados consistem do nu- 
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Figura 2.3 Familias de curvas de Poisson. Cada histograma representa uma distribuigao de pro- 
babilidades com diferente razao de Poisson X. 0 valor de X indica o numero de resultados positi¬ 
ves, e p(X) e a probabilidade daquele resultado calculada atraves da Equa^ao 2.5. Em contraste as 
distribuiq:6es binomiais mostradas nas Figuras 2.1 e 2.2, a de Poisson e especificada por urn unico 
parametro, X, que e a taxa de ocorrencia de eventos independentes (ou o numero durante urn 
dado intervalo de tempo). Conforme aumenta o valor do X, a distribui^ao de Poisson se torna mais 
simetrica. Quando X e muito grande, a distribui^ao de Poisson e praticamente indistinguivel de 
uma normal. 


mero de populates de Rhexia registrados em cada um dos 349 municipios de 
Massachusetts entre 1913 e 2001 (Craine, 2002). Apesar de cada popula«;ao poder 
ser considerada uma tentativa de Bernoulli independente, nos sabemos apenas o 
numero de populates, e nao o de plantas individuals; os dados em cada munici- 
pio e nossa unidade amostral. Nessas unidades amostrais (municipios), a maioria 
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(344) nao continha nenhuma popula^ao em nenhum dos anos, mas um dos mu¬ 
nidpios continha ate 5 populates. O numero medio de populates e 12/349, ou 
0,03438 popula^oes/municipio, que iremos usar como o parametro, da razao 
da distribui^ao de Poisson. Posteriormente, usamos a Equa<;ao 2.5 para calcular 
a probabilidade de obter um dado numero de populates em cada munidpio. 
Multiplicand© essas probabilidades pelo numero do tamanho amostral (n = 349), 
obtemos a frequencia esperada em cada classe de populates (de 0 a 5), que pode 
ser comparada ao numero observado (Tabela 2.2). 

As frequences observadas correspondem bem as predi^oes do modelo de 
Poisson; elas nao sao significativamente diferentes uma da outra (usamos um tes¬ 
te de chi-quadrado para compara-las; ver Capitulo 11). Podemos imaginar que 
o munidpio que tern cinco populates de uma planta rara seja um alvo-chave 
para as atividades de manejo e conserva^ao - o solo e especialmente bom ou ha 
habitats unicos naquele munidpio? Independente da causa final da ocorrencia e 
persistence da Rhexia nesses munidpios, o bom ajuste desses dados a distribui- 
<;ao de Poisson sugere que as populates sao aleatorias e independentes; cinco 
populates em um unico munidpio podem apenas representar sorte. Portanto, 
estabelecer estrategias de manejo buscando por munidpios com o mesmo con- 
junto de caracteristicas fisicas pode nao resultar na conserva^ao bem-sucedida da 
Rhexia naqueles munidpios. 


TABELA 2.2 Frequences esperadas e observadas do numero de populates de 

uma planta rara (Rhexia mariana) em munidpios de Massachusetts 


Numero de 
populates de Rhexia 

Probabilidade 
de Poisson 

Frequencia de 
Poisson esperada 

Frequencia 

observada 

0 

0,96 

337,2 

344 

1 

0,033 

11,6 

3 

2 

5,7 x 10 -1 

0,19 

0 

3 

6,5 X lO^ 6 

2,3 X 10~ 3 

0 

4 

5,6 x 10~® 

1,9 x 10' 5 

1 

5 

3,8 x 10' 10 

1,4 x 10' 7 

1 

Total 

1,0000 

349 

349 


A primeira coluna mostra quantas populates foram encontradas em um determinado numero de mu¬ 
nidpios. Apesar de nao haver nenhum maximo teorico para esse numero, o observado nunca excedeu 5. 
Portanto, apenas os valores de 0 a 5 sao mostrados. A segunda coluna apresenta a probabilidade de Poisson 
em obter o numero observado, assumindo uma distribui^ao com razao de Poisson media de X = 0,03438 
popula^oes/cidade. Tal valor corresponde a frequencia observada nos dados (12 populates observadas 
divididas por 349 munidpios investigados = 0,03438). A terceira coluna mostra a frequencia de Poisson 
esperada, que simplesmente e a probabilidade de Poisson multiplicada pelo tamanho amostral de 349. Na 
ultima coluna, temos a frequencia observada, ou seja, o numero de munidpios que contiveram certo nu¬ 
mero de populates de Rhexia . Note a proximidade entre a frequencia observada e a frequencia de Poisson 
esperada, sugerindo que a ocorrencia de populates de Rhexia em um munidpio e um evento aleatorio 
independente. (Dados retirados de Craine, 2002.) 
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0 valor esperado de uma variavel aleatoria discreta 

Variaveis aleatorias assumem muitos valores diferentes, mas a distribui<;ao intei- 
ra pode ser resumida determinando seu valor tipico ou media aritmetica. Voce 
esta familiarizado com a media aritmetica como sendo uma medida da tenden- 
cia central de um conjunto de numeros, que tambem sera abordada no Capitulo 
3, alem de outras estatisticas descritivas uteis que podem ser calculadas a partir 
de dados. Contudo, quando estamos tratando com distributes de probabilida- 
de, a simples media aritmetica e enganosa. Por exemplo, considere uma variavel 
aleatoria binomial X que pode assumir os valores 0 e 50 com probabilidades de 
0,1 e 0,9, respectivamente. A media aritmetica desses dois valores = (0 + 50)/2 = 
25, mas o valor mais provavel dessa variavel aleatoria e 50, que ocorre em 90% 
das vezes. Para obter o valor medio provavel, calculamos a media aritmetica dos 
valores, ponderada por sua probabilidade. Assim, os valores com probabilidades 
maiores contribuem mais que os com probabilidades menores. 

Formalmente, considere uma variavel aleatoria discreta X, que pode assumir 
os valores a,, a 2 ,..., a n , com probabilidades p p p 2 ,..., p n , respectivamente. Defini- 
mos o valor esperado de X, que escrevemos como E(X ) (le-se “a expectativa de 
X”), como sendo: 


n 

E{X) = 2>p,. = a l p l +a 2 p 2 +... + a„p n (2.6) 

i=i 

Tres pontos em rela^ao E(X) sao dignos de nota. Primeiro, a serie: 

2>p, 

i=i 

pode ter um numero finito ou infinito de termos, dependendo da amplitude de 
valores que X pode assumir. Segundo, diferente de uma media aritmetica, a soma 
nao e dividida pelo numero de termos. Como probabilidades sao pesos relativos 
(elas sao redimensionadas na escala entre 0 e 1), a divisao ja foi realizada de ma- 
neira implicita. Por fim, exceto quando todos p ( sao iguais, essa soma nao e o mes- 
mo que a media aritmetica (ver Capitulo 3 para uma discussao adicional). Para as 
tres variaveis aleatorias apresentadas - Bernoulli, binomial e Poisson - os valores 
esperados sao p, np e X, respectivamente. 

A variancia de uma variavel aleatoria discreta 

A expectativa de uma variavel aleatoria descreve a media aritmetica, ou tendencia 
central dos valores. Contudo, este numero (como todas as medias aritmeticas) 
nao da nenhuma ideia sobre a dispersao, ou variagao, entre os valores. E, como em 
uma familia com numero medio de 2,2 filhos, a expectativa nao necessariamente 
dara uma representa<;ao acurada sobre um dado individual. De fato, para algumas 
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distributes discretas, como a binomial ou a de Poisson, nenhuma das variaveis 
aleatorias podera se igualar a expectativa. 

Por exemplo, uma variavel aleatoria binomial que pode assumir os valores 
de -10 e +10, cada valor com probabilidade de 0,5, tern a mesma expectativa que 
uma variavel aleatoria binomial que pode assumir os valores de -1.000 e +1.000, 
cada um com probabilidade de 0,5. Ambos tern E(X) = 0, mas em nenhuma dis¬ 
tribute um valor aleatorio de 0 sera gerado. Alem disso, os valores observados 
da primeira distribute se muito mais proximos ao esperado do que os da se- 
gunda. Apesar de a expectativa descrever com acuracia o ponto central de uma 
distribute, precisamos quantificar de alguma forma a disperse dos valores em 
torno do ponto central. 

A variancia de uma variavel aleatoria, que escrevemos como g 2 (X), e uma 
medida de quanto os valores reais diferem do esperado. A variancia de uma varia¬ 
vel aleatoria X e defmida como: 


g 2 (X) = E[X- 

-E(X)] 2 



n 

f n \ 

2 

(2.7) 

II 

IX 

a i~Y* a iPi 


*=1 

\ <=1 ) 




Na Equate 2.6, E(X) e o valor esperado de X, os a, sao os diferentes valores 
possiveis da variavel X, e cada um ocorre a uma probabilidade p r 

Para calcular a ct 2 (X), primeiro calculamos a E(X), subtraimos esse valor 
de X, e entao elevamos a diferen^a ao quadrado. Esta e uma medida basica de 
quanto cada valor de X difere da expectativa E(X).* Como existem diversos va¬ 
lores possiveis de X para variaveis aleatorias (p. ex., dois valores possiveis para 
uma variavel de Bernoulli, n valores possiveis em tentativas de uma variavel 
aleatoria binomial, e infinitamente muitos valores para uma variavel aleatoria 
de Poisson), repetimos esse passo de subtrair e elevar ao quadrado para cada 
valor possivel de X. Por fim, calculamos a expectativa desses desvios quadra- 
dos seguindo o mesmo procedimento da Equa<^ao 2.6: cada desvio quadrado e 
ponderado por seu valor de probabilidade de ocorrencia (p,) e posteriormente 
sao somados. 

Assim, no exemplo acima, se Y e uma variavel aleatoria binomial que pode 
assumir os valores -10 e +10, cada um com P(Y) 0,5, entao CT(Y) = 0,5(-10 - 0) 2 
+ 0,5(10 - 0) 2 = 100. Similarmente, se Z e uma variavel aleatoria binomial que 
assume os valores -1.000 e +1.000, entao g 2 (Z) = 100.000. Tal resultado apoia a 


8 Voce pode estar se perguntando por que elevar o desvio ao quadrado E(X) uma vez que ele e calcula- 
do. Se simplesmente somar os desvios sem elevar ao quadrado descobrira que a soma e sempre 0, pois 
E(X) e o ponto central de todos os valores de X. Estamos interessados na magnitude da diferen^a, 
independente do seu sinal, de forma que poderiamos usar os valores do desvio absoluto \X - E(X)\. 
Contudo, a algebra de valores absolutos nao e tao simples quanto elevar ao quadrado, que tambem 
tern melhores propriedades matematicas. Essa soma de quadrados, [E(X - E(X))] 2 , forma a base da 
analise de variancia (ver nota de rodape 1 e o Capitulo 10). 
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intui^ao de que Z tem uma “dispersao” maior que Y. Por fim, note que se todos os 
valores da variavel aleatoria sao identicos [i.e.,X = E(X), entao o 2 (X) = 0, e nao ha 
varia^ao nos dados. 

Para as tres variaveis discretas apresentadas - Bernoulli, binomial e Poisson - 
as variancias saop(l - p), np( 1 -p) e X, respectivamente (Tabela 2.3). A expectati- 
va e a variancia sao os dois descritores mais importantes de uma variavel aleatoria 
ou de uma distribui^ao de probabilidade. O Capitulo 3 discute outras medidas 
descritivas de variaveis aleatorias. Agora, vamos voltar nossa aten^ao para as va¬ 
riaveis continuas. 

VARIAVEIS ALEATORIAS CONTINUAS 

Muitas variaveis ecologicas e ambientais nao podem ser representadas como va¬ 
riaveis continuas. Por exemplo, o comprimento das asas de aves ou a concentra- 
<;ao de pesticidas em tecidos de peixes podem assumir qualquer valor (delimita- 
dos por um intervalo com limites superior e inferior apropriados) e a precisao 
com que o valor e medido e limitada apenas pela instrumenta^ao disponivel. 
Quando trabalhamos com variaveis aleatorias discretas, somos capazes de de- 
finir o espa«;o amostral total como sendo um conjunto de resultados discretos 
possivel. Contudo, quando com variaveis continuas, nao podemos identificar 
todos os eventos ou resultados possiveis, pois existem milhares deles (frequente- 
mente sao muitos e incontaveis; ver nota de rodape 4, Capitulo 1). Similarmente, 
como as observa 9 oes podem assumir qualquer valor dentro de um intervalo 


TABELA 2.3 Tres distributes estatisticas discretas 


Distribuinao 

Valor da Probabilidade 

E(X) 

c\X) 

Comentarios 

Exemplo 

ecologico 

Bernoulli 

P(X)=P 

P 

p(l-p) 

Use para resulta¬ 
dos dicotomicos. 

Se reproduzir 
ou nao, esta e 


Binomial 


Poisson 


P(X) = 


n' 




p x (l-p)" x np tip(l-p) 


x\ 


Use para o nu- 
mero de sucessos 
em n tentativas 
independentes. 
Use para eventos 
independentes 
raros, onde X e a 
taxa na qual os 
eventos ocorrem 
no espa^o ou no 
tempo. 


a questao. 
Presen^a ou 
ausencia de 
especies. 

Distribui<;ao 
de especies 
raras em uma 
paisagem. 


As equates na coluna “valor da probabilidade” determinam a chance de se obter um valor particular X em cada distri- 
bui<;ao. A expectativa E(X) da distribui<;ao de valores e estimada pela media ou media aritmetica da amostra. A variancia 
(T(X) e uma medida de dispersao ou o desvio das observances do E(X). Essas distributes sao para variaveis discretas, as 
quais sao medidas com numeros inteiros ou contagens. 
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definido, e dificil definir a probabilidade de obter um valor em particular. Ilus- 
tramos esses assuntos conforme descrevemos nosso primeiro tipo de variavel 
aleatoria continua, a do tipo uniforme. 

Variaveis aleatorias uniformes 

Ambos os problemas mencionados acima - definir o espa<;o amostral apro- 
priado e obter a probabilidade para qualquer dado valor - sao solucionaveis. 
Primeiramente, reconhecemos que o espa^o amostral nao e mais discreto, mas 
continuo. Em um espa^o amostral continuo, nao consideramos mais resultados 
discretos (como X — 2), mas mantemos o foco em eventos que ocorrem dentro 
de um determinado subintervalo (como 1,5 < X < 2,5). A probabilidade de que 
um evento ocorra dentro de um subintervalo pode ser tratada como um even- 
to, e as nossas regras de probabilidade continuam valendo. Come^aremos com 
um exemplo teorico, o intervalo unitario fechado, que contem todos os nu- 
meros entre 0 e 1, incluindo-os, o qual escrevemos como [0,1]. Neste intervalo 
unitario fechado, suponha que a probabilidade de um evento X ocorrer entre 
0 e 1/4 - p p e a probabilidade desse mesmo evento ocorrer entre 1/2 e 3/4 = 
p 2 . Pela regra em que probabilidade da uniao de dois eventos independentes e 
igual a soma de suas probabilidades (ver Capitulo 1), a chance de que X ocorra 
em qualquer um desses dois intervalos (0 a 1/4 ou 1/2 a 3/4) = p, + p 2 . 

A segunda regra importante e que todas as probabilidades de um evento 
X em um espa^o amostral continuo deve somar 1 (e o Primeiro Axioma da 
Probabilidade). Suponha que, dentro de um intervalo unitario fechado, todos 
os resultados possiveis possuem a mesma probabilidade (imagine, por exem¬ 
plo, um dado com um numero infinito de lados). Apesar de nao podermos 
definir com precisao a probabilidade de se obter o valor 0,1 em uma jogada 
desse dado, podemos dividir esse intervalo em 10 partes com intervalo aberto 
e mesmo comprimento {[0, 1/10], [1/10, 2/10], ..., [9/10, 1]} e calcular a pro¬ 
babilidade de qualquer jogada cair dentro de um desses subintervalos. Como 
voce pode imaginar, a probabilidade de uma jogada cair dentro de qualquer 
um desses subintervalos poderia ser 0,1, e a soma de todas as probabilidades 
desse conjunto = 10 x 0,1 = 1,0. 

A Figura 2.4 ilustra este principio. Neste exemplo, o intervalo varia de 0 a 
10 (no eixo-x). Desenhe uma linha em I paralela ao eixo-x com um intercep¬ 
tor-/ de 0,1. Para qualquer subintervalo U, a probabilidade de, em uma unica 
jogada, o dado cair naquele intervalo pode ser obtida calculando a area do 
retangulo que delimita o subintervalo. Esse retangulo tern comprimento igual 
ao tamanho da altura do subintervalo = 0,1. Se dividirmos o intervalo em u 
subintervalos iguais, a soma de todas as areas desses subintervalos sera igual a 
da area de todo o intervalo: 10 (comprimento) x 0,1 (altura) = 1,0. Este grafi- 
co tambem ilustra que a probabilidade de qualquer resultado a em particular 
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Subintervalo U- [3,4] 


0,10 


g 



Subintervalo U = [3,4] 
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Figura 2.4 Distribui^ao uniforme com intervalo [0,10]. Em uma distribui^ao uniforme conti'nua, 
a probabilidade de urn evento ocorrer em urn subintervalo particular depende da area relativa do 
subintervalo; ela e a mesma independente de onde o subintervalo esta inserido dentro dos limites 
da distribuigao. Por exemplo, se a distribuigao e delimitada por 0 e 10, a probabilidade de que urn 
evento ocorra no subintervalo [3,4] e a area relativa delimitada por aquele subintervalo, que neste 
caso e 0,10. A probabilidade e a mesma para qualquer outro subintervalo com o mesmo tamanho, 
como [1,2] ou [4,5]. Se o subintervalo escolhido e maior, a probabilidade de urn evento ocorrer 
naquele subintervalo sera proporcionalmente maior. Por exemplo, a probabilidade de urn evento 
ocorrer no subintervalo [3,5] e de 0,20 (desde que 2 dentre as 10 unidades do intervalo sejam trans- 
passadas), e e de 0,6 para o subintervalo [2,8]. 

dentro de um espa<;o amostral continuo e 0, pois o subintervalo que content 
somente a e infinitamente pequeno, e um numero infinitamente pequeno divi- 
dido por um numero maior = 0. 

Agora podemos definir uma variavel aleatoria uniforme X com respeito a 
qualquer intervalo I. A probabilidade de sua ocorrencia em qualquer subintervalo 
U e igual ao produto Ux I. No exemplo ilustrado na Figura 2.4, definimos a se- 
guinte fun<;ao para descrever essa variavel aleatoria uniforme: 



1/10, 0<x<10 
0 caso contrario 


A fun 9 ao/(x) e chamada de fun9ao densidade de probabilidade (FDP) para 
a distribui 9 ao uniforme. Em geral, a FDP de uma variavel aleatoria continua e 
encontrada assinalando probabilidades com que variaveis aleatorias continuas X 
ocorrem dentro de um intervalo I. A probabilidade de X ocorrer dentro de um 
intervalo I e igual a area da regiao delimitada por I no eixo-x ef(x) no eixo-y. Pelas 
regras da probabilidade, a area total sob a curva descrita por FDP = 1. 
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Tambem podemos definir a fun^ao de distribui^ao cumulativa (FDC) de 
uma variavel aleatoria X com a fun^ao F(y) = P(X < y). A rela<;ao entre FDP e 
FDC e a seguinte: 

Se X e uma variavel aleatoria com FDP/(x), entao FDC F{y) - P(X < Y) e 
igual a area sob/(x) no intervalo x <y- 


A FDC representa a probabilidade de cauda - ou seja, a probabilidade de 
que uma variavel X seja menor ou igual a algum valor y, [P(X)<y] -eeo mes- 
mo que o familiar valor de P que discutiremos no Capitulo 4. A Figura 2.5, 
abaixo nesta pagina, ilustra a FDP e a FDC para uma variavel aleatoria unifor¬ 
me no intervalo unitario fechado. 

0 valor esperado de uma variavel aleatoria continua 

Apresentamos o valor esperado de uma variavel aleatoria no contexto de uma 
distribui<;ao discreta. Para uma variavel aleatoria discreta, 

E(X)=%a iPi 

i=l 



Figura 2.5 Fun^ao densidade de probabilidade e fun^ao de distribui^ao cumulativa para a dis- 
tribuigao uniforme medida sobre o intervalo unitario fechado [0,1]. A FDP mostra a probabilidade 
P(X) para qualquer valor X. Nessa distribui^ao continua, a probabilidade exata do valor Xe tecni- 
camente 0, pois a area sob a curva e zero quando medida em urn unico ponto. Contudo, a area 
sob a curva de qualquer subintervalo mensuravel e apenas a propor^ao da area total sob a curva, 
a qual por defini^ao e 1,0. Na distribuigao uniforme, a probabilidade de urn evento em qualquer 
subintervalo e a mesma, indiferente de onde o intervalo esta localizado. A FDC, para essa mesma 
distribui^ao, ilustra a area cumulativa sob a curva para o subintervalo que e delimitado inferior- 
mente por 0 e superiormente por 1,0. Como esta e uma distribui^ao uniforme, tais probabilidades 
se acumulam de forma linear. Quando o fim do intervalo 1,0 e atingido, FDC = 1,0, pois a area 
inteira sob a curva foi incluida. 
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Este calculo faz sentido, pois cada valor de a { de X tem uma probabilidade 
associada p { . Contudo, para distributes continuas, como a uniforme, a probabi¬ 
lidade de qualquer observa<;ao em particular e = 0, entao usamos as probabilida- 
des dos eventos ocorrerem dentro de subintervalos no espa<;o amostral. Usamos 
esta mesma abordagem para obter o valor esperado de uma variavel aleatoria 
continua. Para encontrar o valor esperado de uma variavel aleatoria continua 
usaremos subintervalos muito pequenos do espa^o amostral, os quais denota- 
remos como Ax. Para uma fun^ao densidade de probabilidade/(x), o produto 
de /(x;) e Ax resulta no valor da probabilidade de um evento ocorrer dentro do 
subintervalo Ax, escreve-se P{X = x) =/(x ; ) Ax. Essa probabilidade e o mesmo que 
pi no caso discreto. Como na Figura 2.4, o produto de/(Xj) por Ax descreve a area 
de um retangulo muito estreito. No caso discreto, encontramos o valor esperado 
somando o produto de cada x, pela sua probabilidade associada p r No continuo, 
tambem encontramos o valor esperado de uma variavel aleatoria continua so¬ 
mando os produtos de cada X; e sua probabilidade/(Xj) Ax. Obviamente, o valor 
dessa soma dependera do tamanho do subintervalo menor Ax. Contudo, se FDP 
/(x) tem propriedades matematicas “razoaveis” e se permitirmos que Ax fique 
cada vez menor, a soma 

n 

^x,/(x,)Ax 
;=i 

se aproxima de um valor unico limitante. Esse valor limitante = E{X ) para uma 
variavel aleatoria continua. 9 Para uma variavel aleatoria uniforme X, na qual/(X) 
e definida sobre o intervalo [a,b] e onde a < b, 

E{X) = (b + a)/2 

A variancia de uma variavel aleatoria uniforme e: 

v ' 12 


Variavel aleatoria normal 

Talvez a distribui^ao de probabilidades mais familiar seja a “curva de sino” - dis- 
tribui^ao de probabilidade normal (ou de gaussiana). Essa distribui<;ao forma 
as bases teoricas da regressao linear e da analise de variancia (ver Capitulos 9 e 10) 
e se ajusta a muitos conjuntos de dados empiricos. Apresentaremos a distribui^ao 


9 Se voce ja estudou calculo, ira reconhecer esta aproxima^ao. Para uma variavel aleatoria continua X, 
onde/(X) e diferencial dentro do espa<;o amostral, 

E(X) = jxf(x)dx 

A integral representa a soma do produto x x/(X), onde x se torna infinitamente pequeno em seu 
limite. 
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normal com um exemplo de aranhas da familia Linyphiidae. Integrantes dos dife- 
rentes generos deste aracnideo podem ser identificados pelo comprimento de seu 
espinho tibial. Um aracnologo mediu 50 espinhos e obteve a distribuinao ilustra- 
da na Figura 2.6.0 histograma dessas medidas ilustra varios tra<;os caracteristicos 
da distribuinao normal. 

Primeiro, note que a maioria das observances e agregada ao redor do cen¬ 
tra, ou da media aritmetica do comprimento do espinho tibial. Contudo, existem 
grandes caudas no histograma que se estendem para a direita e para a esquerda do 
centra. Em uma distribuinao normal verdadeira (na qual medimos um numero 
infinite de aranhas azaradas), estas caudas se estendem sem defininao em ambas 
as dire<;6es, embora a densidade de probabilidade torna-se rapida e infimamente 
pequena conforme se afasta do centra. Em conjuntos de dados reais, as caudas 
nao se estendem para sempre, pois temos uma quantidade limitada de dados e 
porque a maioria das variaveis medidas nao pode assumir valores negativos. Por 
fim, note que a distribuinao e aproximadamente simetrica: os lados direito e es- 
querdo do histograma sao praticamente espelho um do outro. 



Comprimento do espinho tibial (mm) 


Figura 2.6 Distribuinao normal de um conjunto de medidas morfologicas. Cada observanao 
neste histograma representa uma de 50 medidas do comprimento do espinho tibial de aranhas 
(dados brutos naTabela 3.1). As observances sao agrupadas em "classes" que abrangem intervalos 
de 0,026-mm; o comprimento de cada barra e a frequencia (o numero de observances que caem 
naquela dasse) Superposto ao histograma esta a distribuinao normal, com media de 0,253 e desvio- 
-padrao de 0,0039. Apesar de o histograma nao se acomodar perfeitamente a distribuinao normal, 
o ajuste geral dos dados e muito bom: o histograma exibe um unico pico central, uma distribuinao 
aparentemente simetrica e um decrescimo estavel na frequencia das medidas muito grandes e mui¬ 
to pequenas nas caudas da distribuinao. 
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Se considerarmos o comprimento tibial como uma variavel aleatoria X, pode- 
mos usar a FDP normal para aproximar essa distribui^ao. A distribui^ao normal 
e descrita por dois parametros, que chamaremos de |i e a, portanto/(X) =/(|1 ,<t). 
A forma exata dessa fun^ao nao e importante aqui, 10 mas tern as propriedades 
E(X) - p,G 2 (X) = o 2 ,ea distribui^ao e simetrica em torno de p. E(X) e a expecta- 
tiva e representa a tendencia central dos dados, CT(X) e a variancia e representa a 
dispersao das observances em torno da expectativa. Uma variavel X descrita por 
essa distribui^ao e chamada de variavel aleatoria normal ou de variavel aleato¬ 
ria gaussiana, * 11 e escreve-se: 


10 Se voce almeja os detalhes, a FDP para a distribui^ao normal e: 


/(*) = 



onde n e 3,14159..., e e a base do logaritmo natural (2,71828...), e jli e a sao parametros que de- 
finem a distribui^ao. Voce pode ver a partir dessa formula que, quanto mais distante X esta de |i, 
maior e o expoente negativo de e, e, portanto, menor e a probabilidade calculada de X. A FDC dessa 
distribui^ao, 

x 

F(X)=j f(x)dx 


nao possui uma solu^ao analitica. A maioria dos textos estatisticos fornece tabelas para a FDC da 
distribui^ao normal. Ela tambem pode ser aproximada usando tecnicas de integra^ao numerica em 
programas de computador, como o Matlab ou o S-Plus. 

11 A distribui^ao gaussiana e uma homenagem a Karl Friedrich Gauss 
(1777-1855), um dos mais importantes matematicos na historia. Um filho 

prodigio, ele tern a fama de ter corrigido um erro aritmetico nos calculos da 
folha de pagamentos de seu pai quando tinha apenas 3 anos. Gauss tambem 
provou o Teorema Fundamental da Algebra (todo polinomial tern raiz com 
forma a + bi , onde i = \-1); o Teorema Fundamental da Aritmetica (qual- 
quer numero natural pode ser representado com um produto de numeros 
primos unico); formalizou a teoria dos numeros; e, em 1801, desenvolveu 
um m etodo de ajustar uma linha a um conjunto de pontos usando mmimos 
Karl Friedrich Gauss quadrados (ver Capitulo 9). Infelizmente, Gauss nao publicou seu metodo de 

mmimos quadrados, que geralmente e creditado a Legendre, que o publicou 
10 anos depois. Gauss percebeu que a distribu^ao dos erros no ajuste das linhas por mmimos qua¬ 
drados aproximava o que hoje chamamos de distribui^ao normal, que foi introduzida quase 100 
anos antes pelo matematico americano Abraham de Moivre (1667-1754) em seu livro The Doctrine 
of chances. Como Gauss foi o mais famoso entre os dois (naquele tempo, os Estados Unidos nao 
tinham destaque na matematica), a distribui<;ao de probabilidade normal foi inicialmente tratada 
como distribui^ao gaussiana. Sozinho, De Moivre identificou a distribui^ao normal atraves de seus 
estudos da distribui^ao binomial descrita anteriormente neste capitulo. Contudo, o nome moderno 
“normal” nao foi dado a essa distribui^ao ate o fim do seculo dezenove (pelo matematico Poincare), 
quando o estatistico Karl Pearson (1857-1936) redescobriu o trabalho de De Moivre e mostrou que 
sua descoberta acerca dessa distribui^ao precedeu Gauss. 
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X~ N(p,a) (2.8) 

Muitas distributes normais diferentes podem ser criadas especificando-se 
valores diferentes de |i e a. Contudo, estatisticos usam com frequencia a distri¬ 
bute normal padrao, em que p = 0 e a = l.A variavel aleatoria normal padrao 
associada e comumente tratada apenas como Z. E(Z) = 0, e G"(Z) = 1. 

Propriedades uteis da distribute) normal 

A distribui^ao normal possui tres propriedades uteis. Primeiro, as distributes 
normais podem ser adicionadas. Se voce tern duas variaveis aleatorias normais 
independentes X e Y, a soma delas tambem e uma variavel aleatoria normal com 
E(X + Y) - E(X) + E(Y) e a 2 (X + Y) = g 2 (X) + g 2 (Y). 

Segundo, as distributes normais podem ser facilmente transformadas 
com operates de deslocamento e mudan^a de escala. Considere duas varia¬ 
veis aleatorias X e Y. Permita que X ~ N(p,a), e que Y = aX + b, onde a e b sao 
constantes. Dizemos que a opera^ao de multiplicar X pela constante a e uma 
opera^ao de mudan^a de escala, porque uma unidade de X torna-se a unidades 
de Y; consequentemente, Y aumenta em fun^ao de a. Em contraste, a adi^ao 
da constante b ao X e tratada como uma opera^o de deslocamento, pois sim- 
plesmente deslocamos a variavel aleatoria sobre b unidades ao longo do eixo-x 
atraves da adi^ao de b a X. Operates de deslocamento e mudan<;a de escala sao 
ilustradas na Figura 2.7. 

Se X e uma variavel aleatoria normal, entao uma variavel aleatoria Y, criada 
por uma opera^ao de mudan^a de escala, ou por uma opera^ao de deslocamen¬ 
to, ou por ambas sobre a do tipo X, tambem e uma variavel aleatoria normal. 
Convenientemente, a expectativa e a variancia da nova variavel aleatoria e uma 
fmto simples das constantes de deslocamento e escala. Para duas variaveis alea¬ 
torias X ~ N(fi,o) e Y - aX + b, calculamos E( Y) - a\i + b e c 2 (Y) = a 2 a 2 . Note 
que a expectativa da nova variavel aleatoria, E( Y), e criada aplicando diretamente 
as operates de deslocamento e escala em E(X). Contudo, a variancia de <3~{Y) 
e alterada somente pela opera^ao de escala. Intuitivamente, voce pode observar 
que se todos os elementos de um conjunto de dados sao deslocados pela adi^ao 
de uma constante, a variancia nao deveria mudar, pois a dispersao relativa dos 
dados nao foi afetada ( ver Figura 2.7). Contudo, se aqueles dados forem multipli- 
cados por uma constante a (mudan<;a de escala), a variancia sera acrescida pela 
quantidade a 2 ; pois a distancia relativa de cada elemento da expectativa agora e 
acrescida por um fator de a (Figura 2.7), esta quantidade e elevada ao quadrado 
no calculo da variancia. 
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Figura 2.7 Operates de deslocamento e escala sobre uma distribute) normal. A distribuigao 
normal possui duas propriedades algebricas convenientes. A primeira e uma operagao de desloca¬ 
mento: se a constante b e adicionada a urn conjunto de medidas com media p, a media da nova 
distribuigao sera deslocada para p + b, mas a variancia nao e afetada. A curva preta e o ajuste da 
distribuigao normal a urn conjunto de 200 medidas do comprimento do espinho tibial de aranhas 
(Figura 2.6). A curva cinza mostra a distribuigao normal deslocada apos o valor 5 ser acrescido a 
cada uma das observagoes originais. A media se deslocou 5 unidades para a direita, mas a variancia 
nao e alterada. Em uma operagao de escala (curva verde), multiplicar cada observagao por uma 
constante a causa urn acrescimo na media por urn fator de a 2 . Esta curva e o ajuste da distribuigao 
normal aos dados depois de terem sido multiplicados por 5. A media e deslocada para urn valor 5 
vezes maior que o original, e a variancia aumenta por urn fator de 5 2 = 25. 


Uma propriedade final (e conveniente) da distribuigao normal e o caso espe¬ 
cial de uma mudanga de escala e operagao de deslocamento em que a - 1/g e b = 
-l(|i/G): 

Para X ~ N(p,G), Y = (l/o)X - p/G = (X- p)/G, obtemos 

E(Y) = 0 e g 2 (Y) = 1 

que e uma variavel aleatoria normal padrao. Este e um resultado especialmente 
util, pois significa que toda variavel aleatoria normal pode ser transformada em 
uma variavel aleatoria normal padrao. Alem disso, qualquer operagao que possa 
ser aplicada a uma variavel como esta ira se aplicar a qualquer outra normal apos 
ser devidamente escalonada e deslocada. 
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Outras variaveis aleatorias contmuas 

Existem muitas outras variaveis aleatorias continuas e distributes de proba- 
bilidade associadas que os ecologos e estatisticos usam. Duas importantes sao 
as variaveis aleatorias log-normais e variaveis aleatorias exponenciais (Figura 
2.8). Uma variavel aleatoria log-normal X e uma variavel aleatoria tal como seu 
logaritmo natural ln(X) e uma variavel aleatoria normal. Muitas caracteristicas 
ecologicas-chave de organismos, como massa corporal, sao distribuidas de for¬ 
ma log-normal. 12 

Como a distribui^ao normal, a log-normal e descrita por dois parametros, |i 
e a. O valor esperado de uma variavel aleatoria log-normal e: 

2n+q 2 

E(X) = e~^~ 


E a variancia de uma distribui^ao log-normal e: 



Quando representados graficamente em escala logaritmica, a distribui^ao 
log-normal exibe uma curva em forma de sino. Contudo, se esses mesmos dados 
forem transformados de volta aos valores originais (aplicando a transforma^ao 
e x ), a distribui<;ao resultante e desviada, com uma longa cauda de probabilidade 
se estendendo a direita (Ver Capitulo 8 para mais exemplos em transforma^oes 
de dados). 

Variaveis aleatorias exponenciais sao relacionadas as de Poisson. Relembre 
que estas descrevem o numero de ocorrencias raras (p. ex., contagens), como 


1_ 0 exemplo ecologico mais familiar de uma distribui^ao log-normal e a da abundancia relativa 
das especies em uma comunidade. Se coletar uma amostra aleatoria de individuos de uma comuni- 
dade, classifica-los de acordo com a especie, e construir um histograma de frequencia das especies 
representadas em diferentes classes de abundancia, os dados irao se assemelhar a uma distribui- 
$ao normal quando as classes de abundancia sao representadas graficamente em escala logaritmica 
(Preston, 1948). Qual e a explica^ao para este padrao? Por um lado, muitos conjuntos de dados 
nao biologicos (como a distribui^ao do patrimonio liquido entre paises, ou a distribui^ao do tem¬ 
po de dura^ao de copos em um restaurante cheio) tambem seguem uma distribui(;ao log-normal. 
Portanto, o padrao pode refletir uma resposta estatistica generica de populates aumentando ex- 
ponencialmente (um fenomeno logaritmico) a muitos fatores independentes (May, 1975). Por ou- 
tro lado, mecanismos biologicos especificos podem estar atuando, incluindo dinamica de manchas 
(Ungland & Gray, 1982) ou parti^ao hierarquica de nichos (Sugihara, 1980). O estudo de distri¬ 
butes log-normal tambem e complicado por problemas amostrais. Como especies raras em uma 
comunidade podem ser perdidas em amostras pequenas, a forma da distribui^ao de abundancia das 
especies se altera com a intensidade da amostragem (Wilson, 1993). Nao obstante, mesmo em co- 
munidades bem amostradas, a cauda do histograma de frequences pode nao se ajustar muito bem 
a uma distribui^ao log-normal verdadeira (Preston, 1981). Esta falta de ajuste pode surgir porque 
uma amostra grande de uma comunidade em geral contera um misto de especies residentes e em 
transi^ao (Magurran & Henderson, 2003). 
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Figura 2.8 Distributes log-normal e exponencial se ajustam a certos tipos de dados ecologi- 
cos, como a distribuigao de abundancias de especies e distances de dispersao de sementes. (A) A 
distribu tao log-normal e descrita por dois parametros, media e variancia, ambos sao 1 neste exem- 
plo. (B) A distribuigao exponencial e descrita por urn unico parametro b, que e 2 nesse exemplo. 
Ver a Tabela 2.4 para as equates usadas com as distributes log-normal e exponencial. Ambas 
as distributes, log-normal e exponencial, sao assimetricas, com uma longa cauda a direita que 
desvia a distributed a direita. 


o numero de visitas em um intervalo de tempo constante, ou o de individuos 
que ocorrem em uma area fixa. Os “espa<;os” entre variaveis aleatorias discretas, 
como o tempo ou a distancia entre eventos de Poisson, podem ser descritos como 
variaveis aleatorias exponenciais continuas. A fim^ao de distribui^ao de proba- 
bilidades de uma variavel aleatoria exponencial X tern apenas um parametro, 
geralmente escrita como (3, e toma a forma P(X) = (3e -|5x . O valor esperado de 
uma variavel aleatoria exponencial = 1/(3, e variancia l/(3\' A Tabela 2.4 traz um 
sumario das propriedades dessas distributes continuas comuns. 

Outras variaveis aleatorias continuas e suas fun<;oes de distribuito de pro- 
babilidades sao usadas extensivamente em analises estatisticas. Elas incluem 
a distribuito-t de Student, chi-quadrado, F, gamma, gamma inversa e beta. 
Iremos discuti-las mais adiante, quando as usarmos em tecnicas estatisticas 
especificas. 


13 £ facil simular uma variavel aleatoria continua em seu computador, tirando vantagem do fato 
de que se Ue uma variavel aleatoria uniforme defmida no intervalo unitario fechado [0,1], entao 
—ln( U )/\3 e uma variavel aleatoria exponencial com parametro (3. 
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TABELA 2.4 

Quatro distributes continuas 



Distribuinao 

Valor de 
probabilidade 

E(X) 

a 2 (X) 

Comentarios 

Exemplo 

ecologico 

Uniforme 

P{a<X<b) = 1,0 

b+a 

2 

(i b-af 

12 

Use para resultados 
equiprovaveis sobre 
o intervalo [a,b]. 

Distribui<;ao 
uniforme dos 

recursos. 

Normal 

. 


G 2 

Gera uma curva 
simetrica em “for¬ 
ma de sino” para 
dados continuos. 

Distribuinao do 
comprimento do 
espinho tibial e 




outras variaveis 
continuas de 
tamanho. 

Log-normal 

lfNXJ-n'j 

1 c 2 ‘ ° J 

2 

2H+C 2 


Dados transforma- 
dos em log de da- 
1 dos desviados para 

Distribui^ao 
das classes de 
abundancia das 


axjln 

e 2 

Le 2 J L 

J a direita ffequente- 
mente se ajustam a 
curva normal. 

especies. 

Exponencial 

P(X) = 

1/(3 

l/(3 2 

Distribui<;ao con- 
tinua analoga a de 
Poisson. 

Distancia de 
dispersao de 
sementes. 


A equa^ao do valor de probabilidade determina a chance de obter um determinado valor X para cada distribui^ao. A ex- 
pectativa E(X) da distribui<;ao de valores e estimada pela media ou media aritmetica de uma amostra. A variancia cf (X) e 
uma medida da dispersao ou desvio das observances do £(X). Essas distributes sao para variaveis em uma escala conti- 
nua que pode assumir qualquer numero real, apesar de a distribuinao exponencial ser limitada aos valores positivos. 


OTEOREMA DO LIMITE CENTRAL 

O Teorema do Limite Central e um dos pilares da probabilidade e analises esta- 
tisticas. N Segue uma breve descri^ao do teorema. Permita que S n seja a soma ou a 




Pierre Laplace 


11 A formula^ao inicial do Teorema do Limite Central foi contribuinao de 
Abraham De Moivre (Informanoes biograficas na nota de rodape 11) e Pier¬ 
re Laplace. Em 1733, De Moivre provou sua versao do Teorema do Limite 
Central para uma variavel aleatoria de Bernoulli. Pierre Laplace (1749-1827) 
estendeu os resultados de De Moivre para qualquer variavel aleatoria binaria. 
Laplace e mais lembrado por seu Mecanique celeste (Mecanica celeste), que 
traduziu o sistema geometrico dos estudos de mecanica de Newton para um 
sistema com base em calculos. De acordo com Boyer, em History of Mathema¬ 
tics (1968), apos Napoleao ter lido Mecanique celeste ele perguntou a Laplace 
por que nao havia nenhuma mennao a Deus no trabalho. Dizem que Laplace 
respondeu que ele nao era necessario para aquela hipotese. Posteriormen- 
te, Napoleao apontou Laplace para ser Ministro do interior, mas mais tarde 
demitiu-o com o comentario de que “ele carregou o espirito do infinitamente 
pequeno para a gestao dos negocios” {fide Boyer, 1968). O matematico russo 
Pafnuty Chebyshev (1821-1884) provou o Teorema do Limite Central para 
qualquer variavel aleatoria, mas sua prova complexa e virtualmente desco- 
nhecida na atualidade. A prova moderna acessivel do Teorema do Limite 
Central e contribuinao de Andrei Markov (1856-1922) e Alexander Lyapou- 
nov (1857-1918), alunos de Chebyshev. 
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media aritmetica de qualquer conjunto de n variaveis aleatorias X,, independentes 
e distribuidas de forma identica: 

S„ = £x, 

1=1 

cada uma com o mesmo valor esperado p e todas com a mesma variancia a 2 . 
Entao, S„ tern o valor esperado de n\i e variancia n<5~. Se padronizarmos S„ sub- 
traindo o valor esperado de cada observa^ao e dividindo pela raiz quadrada da 
variancia, 

c _ 

_ S n _ J5I_ 

std a4n aVn 

entao, a distribui^ao de um conjunto de valores Spad aproxima uma variavel nor¬ 
mal padrao. 

Este e um resultado poderoso. O Teorema do Limite Central afirma que pa- 
dronizar qualquer variavel aleatoria, que em si e a soma ou media aritmetica de 
um conjunto de variaveis aleatorias independentes, resulta em uma nova varia¬ 
vel, que e “quase o mesmo que” lj uma normal padrao. Ja utilizamos essa tec- 
nica quando geramos uma variavel aleatoria normal padrao Z a partir de uma 
variavel aleatoria normal (X). A beleza do Teorema do Limite Central e que ele 
nos permite usar ferramentas estatisticas que requerem que nossas observances 
amostrais sejam tiradas de um espa^o amostral normalmente distribuido, mes¬ 
mo que os dados subjacentes nao o sejam. As unicas ressalvas sao que o tamanho 
amostral precisa ser “suficientemente grande”, 16 e que as observances devem ser 
independentes e tiradas a partir de uma distribuinao com expectativa e variancia 
comuns. Demonstraremos a importancia do Teorema do Limite Central quan¬ 
do discutirmos as diferentes tecnicas estatisticas usadas por ecologos e cientistas 
da area ambiental (Capitulos 9-12). 


5 Mais formalmente, o Teorema do Limite Central declara que, para qualquer variavel padronizada 

v-np 


a area sob a distribuinao de probabilidade normal padrao no intervalo (a,b) e igual a: 

lim P{a < Yj < b) 

i—>oo 


16 Uma questao importante para ecologos (e estatisticos) e com que velocidade a probabilidade 
P{a < Y i < b ) converge para a area sob a distribuinao de probabilidade normal padrao. Muitos eco¬ 
logos (e estatisticos) poderiam dizer que o tamanho amostral i deve ser no minimo 10, mas estudos 
recentes sugerem que i deve exceder 10.000 antes de as duas convergirem ate mesmo a duas casas 
decimals. Felizmente, a maioria dos testes estatisticos vai ao encontro da premissa de normalidade, de 
forma que podemos usar o Teorema do Limite Central mesmo que nossos dados padronizados nao 
exibam com perfei^ao uma distribuinao normal. Hoffman Jorgensen (1994; ver tambem o Capitulo 
5) fez uma revisao minuciosa e tecnica do Teorema do Limite Central. 
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RESUMO 


Variaveis aleatorias assumem uma variedade de medidas, mas suas distribu¬ 
tes podem ser caracterizadas por sua expectativa e variancia. Distributes 
discretas, como as de Bernoulli, binomial e Poisson, se aplicam a dados que sao 
contagens discretas, enquanto que distributes continuas, como a uniforme, 
normal e exponencial, se aplicam a dados medidos em uma escala continua. 
Independente da distribute subjacente, o Teorema do Limite Central afir- 
ma que as somas ou medias aritmeticas de amostras grandes e independentes 
seguem a distribui^ao normal se forem padronizadas. Para uma ampla varie¬ 
dade de dados, incluindo aqueles coletados mais comumente por ecologos e 
cientistas da area ambiental, o Teorema do Limite Central apoia o uso de testes 
estatisticos que assumem distribute) normal. 



3 

Estatfsticas Descritivas: 
Medidas de Posigao 

e Dispersao 


Os dados sao a essencia das investigates cientfficas, porem raramente mostra- 
mos todos os que coletamos. Ao inves disso, resumimos nossos dados utilizando 
estatfsticas descritivas. Biologos e estatisticos distinguem entre duas formas de 
estatfsticas descritivas: medidas de posi^ao e medidas de dispersao. As medidas 
de posi^ao ilustram onde a maioria dos dados se encontra; essas medidas incluem 
as medias, medianas e modas. Por outro lado, medidas de dispersao descrevem o 
quanto os dados sao variaveis; essas medidas incluem o desvio-padrao amostral, a 
variancia e o erro-padrao. Apresentaremos as estatfsticas descritivas mais comuns 
e ilustraremos como elas surgem diretamente da Lei dos Grandes Numeros, um 
dos mais importantes teoremas da probabilidade. 

De agora em diante, adotaremos a nota^ao estatistica padrao quando descre- 
vermos variaveis aleatorias e quantidades estatfsticas ou estimadores. Variaveis 
aleatorias serao designadas como Y, em que cada observa^ao individual e inde- 
xada com um subscrito, Y t . O subscrito i indica a i-esima observa^ao. O tamanho 
da amostra sera denotado por n, de forma que o x pode assumir qualquer valor 
entre 1 e n. A media aritmetica e escrita como Y. Parametros desconhecidos (ou 
popula^ao estatistica) de distributes, como valores esperados e variancias, serao 
escritos com letras gregas (como (i. para o valor esperado, a 2 para a variancia es- 
perada e a para o desvio-padrao esperado), enquanto os estimadores estatisticos 
desses parametros (com base em dados reais) serao escritos com letras em italico 
(como Y para a media aritmetica, s 2 para a variancia da amostra e s para o desvio- 
-padrao amostral). 

Neste Capftulo usaremos como exemplo os dados ilustrados na Figura 2.6, as 
medidas simuladas do comprimento do espinho tibial de 50 aranhas Linyphiidae. 
Esses dados, colocados em ordem ascendente, sao ilustrados na Tabela 3.1. 
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TABELA 3.1 Medidas, em ordem crescente, dos espinhos tibiais de 50 aranhas 
Linyphiidae (em milimetros) 


0,155 

0,207 

0,219 

0,228 

0,241 

0,249 

0,263 

0,276 

0,292 

0,307 

0,184 

0,208 

0,219 

0,228 

0,243 

0,250 

0,268 

0,277 

0,292 

0,308 

0,199 

0,212 

0,221 

0,229 

0,247 

0,251 

0,270 

0,280 

0,296 

0,328 

0,202 

0,212 

0,223 

0,235 

0,247 

0,253 

0,274 

0,286 

0,301 

0,329 

0,206 

0,215 

0,226 

0,238 

0,248 

0,258 

0,275 

0,289 

0,306 

0,368 


Este conjunto de dados simulados e utilizado ao longo deste Capitulo para ilustrar medidas de estatisticas 
descritivas e distribui^ao de probabilidades. Embora dados brutos deste tipo formem as bases de todos os 
calculos na estatistica, raramente sao publicados, pois eles sao muito extensos e dificeis de compreender. 
Estatisticas descritivas, se usadas de maneira adequada, comunicam e descrevem com concisao os padroes 
nos dados brutos sem enumerar cada observa^ao individual. 


MEDIDAS DEP0SKA0 
A media aritmetica 

Existem diversas formas de descrever um conjunto de dados. A mais familiar e 
a media aritmetica das observances, que e calculada pela soma das observances 
(Y;), dividida pelo numero de observances ( n ) e e denotada por Y: 

n 

Y = -^— (3.1) 

n 


Para os dados da Tabela 3.1 Y = 0,253. A Equanao 3.1 parece similar, mas nao 
e equivalente a Equanao 2.6, que foi utilizada no Capitulo 2 para calcular o valor 
esperado de uma variavel aleatoria discreta: 

«n=5>ipi 

i=l 

onde os Y, sao os valores que a variavel aleatoria pode ter, e os p, sao suas pro¬ 
babilidades. Para uma variavel continua na qual cada Yj ocorre apenas uma vez, 
com p, = 1 In, as Equanoes 3.1 e 2.6 dao resultados identicos. 

Por exemplo, deixe que comprimento do espinho seja um conjunto constituido 
pelas 50 observances da Tabela 3.1: Comprimento do espinho = {0,155, 0,184,..., 
0,329,0,368}. Se cada elemento (ou evento) dentro do comprimento do espinho e 
independente dos outros, entao a probabilidade p. de qualquer uma dessas 50 ob¬ 
servances independentes e 1/50. Usando a Equanao 2.6, podemos calcular o valor 
esperado do comprimento do espinho como: 

e(y) = jri>, 

i =1 
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onde y, e o i-esimo elemento e p, = 1/50. Esta soma: 




50 


agora e equivalente a Equa^ao 3.1, usada para calcular a media aritmetica de 
n observances de uma variavel aleatoria Y. 


n n n 

f=lp : y, = ^y,x±=l o ly, 


i=l 


i=i 


Para calcular o valor esperado de comprimento do espinho, usamos a formula 
para o valor esperado de uma variavel aleatoria discreta (Equa^ao 2.6). Contu- 
do, os dados da Tabela 3.1 representam observances de uma variavel aleatoria 
continua normal. Tudo que sabemos sobre o valor esperado dessa variavel e que 
ele tern algum valor verdadeiro subjacente, que denotamos como p. O valor da 
media calculado para o comprimento do espinho tern alguma relanao com o valor 
desconhecido de p? 

Se tres condinoes forem satisfeitas, a media aritmetica das observances em 
nossa amostra e um estimador imparcial de p. Essas tres condinoes sao: 

1. As observances sao feitas em individuos escolhidos de maneira aleatoria. 

2. As observances na amostra sao independentes umas das outras. 

3. As observances sao realizadas em uma populanao maior, que pode ser descrita 

por uma variavel aleatoria normal. 

O fato de que a Y de uma amostra aproxima a p da populanao, da qual foi 
retirada, e um caso especial do segundo teorema fundamental da probabilidade, a 

Lei dos Grandes Numeros . 1 

Eis uma descrinao da Lei dos Grandes Numeros. Considere um conjunto in¬ 
finite de amostras aleatorias de tamanho n, tiradas de uma variavel aleatoria Y. 
Assim, Fj e uma amostra de Y com um dado, {/,}. Entao, Y 2 e uma amostra de ta¬ 
manho 2, {/,, y 2 j, etc. A Lei dos Grandes Numeros estabelece que, conforme o ta¬ 
manho amostral n aumenta, a media aritmetica de Y { (Equanao 3.1) aproxima-se 
do valor esperado de Y,E(Y). Em notanao matematica, escrevemos: 



1 A versao moderna (ou “poderosa”) da Lei dos Grande Numeros foi provada 
pelo matematico russo Andrei Kolmogorov (1903-1987), que tambem estu- 
dou os processos de Markov como aqueles utilizados na moderna computa- 
<;ao de analises bayesianas (ver Capitulo 5) e mecanica de fluidos. 


Andrei Kolmogorov 
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( n > 

lr, _ 



lim 

n—> oo 

i =1 - V 

= E(Y ) 

(3.2) 

— in 

n 


\ ) 




Em palavras, dizemos que conforme n se torna muito grande, a media aritme- 
tica das Y j e igual a E(Y) ( ver Figura 3.1). 

Em nosso exemplo, os comprimentos do espinho tibial de todos os indivi- 
duos de aranhas Linyphiidae em uma popula<^ao podem ser descritos como uma 
variavel aleatoria normal com valor esperado = fi. Nao podemos medir todos os 
(muitos) espinhos, mas sim um subconjunto deles; a Tabela 3.1 traz n- 50 dessas 
medidas. Se cada espinho foi medido em uma aranha individual, se cada aranha 
foi escolhida aleatoriamente para ser medida e se nao ha nenhum vies em nos- 
sas medidas, entao o valor esperado de cada observa^ao deve ser o mesmo (pois 
eles fazem parte da mesma popula^ao, infmitamente grande, de aranhas). A Lei 
dos Grandes Numeros diz que o comprimento medio dos espinhos de nossas 50 
medidas se aproxima do valor esperado do comprimento dos espinhos em toda 
a popula^ao. Por isso, podemos estimar o valor esperado |U desconhecido com a 
media aritmetica de nossas observances. Como mostra a Figura 3.1, a estimativa 
da verdadeira media da popula^ao torna-se mais confiavel conforme acumula- 
mos mais dados. 

Outras medias 

A media aritmetica nao e a unica medida de posinao de um conjunto de dados. 
Em alguns casos, ira produzir respostas inesperadas. Por exemplo, suponha que 
uma popula^ao de veado-mula* * (Odocoileus hemionus) aumenta 10% em tama- 
nho em um ano e 20% no proximo ano. Qual e a taxa de crescimento medio da 
populanao a cada ano? 2 A resposta nao e 15%! 

Voce pode ver esta diferen<;a trabalhando com alguns numeros. Suponha 
que o tamanho inicial da popula<;ao e de 1.000 veados. Apos um ano, seu ta- 


2 Nesta analise, usamos a taxa finita de crescimento, X, como parametro do crescimento populacio- 
nal. Trata-se de um multiplicador que opera no tamanho populacional a cada ano, como N t+l = XN x . 
Assim, se a popula^ao cresce 10% a cada ano, X = 1,10, ou se a popula<;ao decresce 5% a cada ano, X 
= 0,95. Uma medida similar a taxa de crescimento populacional e a taxa de crescimento instantaneo, 
r, na qual as unidades sao individuos/(individuos x tempo). Matematicamente, X = e e r = ln(X). Ver 
Gotelli (2001**) para mais detalhes. 

* N. de T. O veado-mula (Odocoileus hemionus) e um veado norte-americano. Ele e encontrado em 
todo o oeste da America do Norte, desde o sul de Yukon, no Alasca, ate a baixa California e o norte 
do Mexico. 

** N. deT. Este livro ja esta na 4' 1 edi^ao, publicada em 2008. A obra foi traduzida para o portugues 
pela editora PLANTA, com o titulo de Ecologia. 
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Figura 3.1 llustra^ao da Lei dos Grandes Numeros e a constru^ao de intervalos de confian^a usan- 
do os dados dos espinhos tibiais de aranhas da Tabela 3.1. A media da populagao (0,253) e indicada 
pela linha pontilhada. A media amostral para amostras de tamanhos crescentes (n) e indicada pela 
linha solida central e ilustra a Lei dos Grandes Numeros: conforme o tamanho amostral aumenta, a 
media amostral se aproxima da verdadeira media da popula^ao. As linhas solidas superior e a inferior 
ilustram o intervalo de confian^a de 95% ao redor da media. A largura do intervalo de confian^a 
decresce conforme o tamanho amostral aumenta. Intervalos de confian^a de 95% construi'dos dessa 
forma devem conter a verdadeira media da popula^ao. Note, contudo, que existem amostras (entre 
as setas) para as quais o intervalo de confian^a nao inclui a verdadeira media da popula<;ao. As cur- 
vas foram construfdas usando algoritmos e codigos do S-Plus publicados por Blume e Royal (2003). 


manho (N,) sera de (1,10) x 1.000 = 1.100. Apos o segundo ano, o tamanho 
populacional ( N 2 ) sera (1,20) x 1.100 = 1.320. Contudo, se a taxa de crescimento 
medio por ano for de 15%, o tamanho populacional sera de (1,15) x 1.000 = 
1.150 apos um ano e(l,15)x 1.150= 1.322,50 apos dois anos. Esses numeros 
sao proximos, mas nao identicos; apos mais alguns anos, os resultados irao di- 
vergir substancialmente. 

A media geometrica No Capitulo 2, apresentamos a distribui^o log-normal: 
se Ye uma variavel aleatoria com distribui^ao log-normal, entao a variavel 
aleatoria Z = ln(y) e uma variavel aleatoria normal. Se calcularmos a media 
aritmetica de Z, 



(3.3) 


qual e o valor expresso em unidades de Y? Primeiro, reconhe^a que se Z = ln( Y), 
entao Y = e z , onde e e a base do logaritmo natural e e igual a -2,71828.... Assim, o 
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valor de Z em unidades de Ye e z . Essa media de transforma^ao reversa e chama- 
da de media geometrica e e escrita como MG y . 

A forma mais simples para calcular a media geometrica e tirar o antilog da 
media aritmetica: 




(3.4) 

MG Y = e 

L *=i J 



Uma boa caracteristica e que a soma dos logaritmos de um conjunto de nu- 
meros se iguala ao de seus produtos: ln(Y,) + ln(Y 2 ) + ... = ln( Y, Y 2 ... YJ. Portan- 
to, outra forma de calcular a media geometrica e tirar a n-esima raiz do produto 
das observa^es: 


MG y = i/Y,r 2 ...Y„ ( 3 . 5) 

Da mesma forma que temos um simbolo especial para adicionar uma serie 
de numeros: 

= y,+y 2 +- + y„ 

i= 1 

tambem temos um simbolo especial para a multiplica^ao de uma serie de numeros: 

flr,-Y,xY 1 x ... xy, 

1=1 

Assim, tambem podemos escrever a formula da media geometrica como: 

MG r =^Y; 

Vamos ver se a media geometrica da taxa de crescimento populacional faz um 
trabalho melhor na predi<;ao da taxa de crescimento medio que a media aritme¬ 
tica faz. Primeiro, se expressarmos as taxas de crescimento populacional como 
multiplicadores, as taxas de crescimento anual de 10% e de 20% se tornam 1,10 
e 1,20, e o logaritmo natural desses dois valores e ln(l,10) = 0,09531 e ln(l,20) = 
0,18232. A media aritmetica desses dois valores e 0,138815. O calculo reverso nos 
da a media geometrica de MG Y = e ' = 1,14891, que e um pouco menor que a 

media aritmetica de 1,20. 

Agora podemos calcular a taxa de crescimento populacional ao longo de dois 
anos, usando a taxa de crescimento da media geometrica. No primeiro ano, a po- 
pula<;ao poderia crescer para (1,14891) x (1.000) = 1148,91; no segundo ano, para 
(1,14891) x (1.148,91) = 1.319,99. Esta e a mesma resposta que obtemos com um 
crescimento de 10% no primeiro ano e de 20% no segundo ano [(1,10) x (1.000) 
x (1,20)] = 1.320. Os valores iriam se igualar perfeitamente se as taxas de cresci- 
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mento nao tivessem sido arredondadas. Note, tambem, que, apesar de o tamanho 
populacional ser sempre uma variavel de numeros inteiros (0,91 veado pode ser 
visto somente em uma floresta teorica), nos a tratamos como uma variavel conti- 
nua para ilustrar esses calculos. 

Por que a MG y nos da a resposta correta? A razao e que o crescimento da po- 
pula^ao e um processo multiplicativo. Note que: 


N 


2 _ 


^2 
v N i y 


X 


El" 


Ei 

v N i y 


v^oy 


Contudo, numeros que sao multiplicados em uma escala aritmetica podem 
ser adicionados em uma logaritmica. Assim 


f n 2 ) 


(nA 


= In 

^ \T ^ 

+ ln 

fM 


X 



Z 

LUiJ 


l^oj 



WJ 




Media harmonica Um segundo tipo de media pode ser calculado de forma si¬ 
milar, usando a transforma«;ao do inverso (1/Y). O inverso da media aritmetica 
dos inversos de um conjunto de observances e chamado de media harmonica: 





(3.6) 


Para os dados dos espinhos da Tabela 3.1, MG y = 0,249 e H y = 0,246. Ambas as 
medias sao menores que a aritmetica (0,253); em geral, essas medias sao ordena- 
das como y > GM y > H y • Contudo, se as observances sao iguais (7, = Y 2 - Y 3 =... 
Y n ) y as tres medias sao identicas (p = GM y = H y )- 


A media harmonica e usada em biologia da conserva^ao e gene- 
tica de popula^oes para calcular o tamanho populacional efetivo, 
que e o equivalente a uma popula^ao com acasalamentos comple- 
tamente ao acaso. Se o tamanho populacional efetivo e pequeno (< 
50), mudan^as ao acaso na frequencia dos alelos, devido a deriva 
genetica, sao potencialmente importantes. Se o tamanho popula¬ 
cional muda de um ano para o outro, a media harmonica da o ta¬ 
manho populacional efetivo. Por exemplo, imagine que uma popu- 
la<;ao estavel de 100 lontras marinhas passa por um severo gargalo e e reduzida para um tamanho 
populacional de 12 em um unico ano. Assim, os tamanhos da popula^ao sao 100, 100, 12, 10, 100, 
100, 100, 100, 100, 100 e 100. A media aritmetica e 91,2, mas a media harmonica e somente 57,6, 
sendo considerado o tamanho populacional efetivo no qual a deriva genetica pode ser importante. 
A media harmonica nao somente e menor que a aritmetica, como tambem e especialmente sen- 
sfvel a valores extremos, que sao pequenos. Nos seculos XVIII e XIX, as lontras marinhas da costa 
do Pacifico da America do Norte passaram por um severo gargalo populacional quando foram 
extensivamente ca^adas. Apesar de as populates de lontras marinhas terem se recuperado em 
tamanho, ainda exibem pouca diversidade genetica. (Larson et al., 2002.) (Fotografia de Warren 
Worthington, http://soundwaves.usgs.gov/2002/07/.) 
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Outras medidas de posi^ao: a mediana e a moda 

Ecologos e cientistas da area ambiental em geral usam outras duas medidas de posi- 
9 S 0 , a mediana e a moda, para descrever conjuntos de dados. A mediana e defmida 
como o valor em um conjunto de observances ordenadas que tenha um numero igual 
ao de observances acima e abaixo dele. Em outras palavras, a mediana divide um 
conjunto de dados em duas metades com o mesmo numero de observances em cada 
uma. Para um numero impar de observances, a mediana e apenas o valor central. 
Assim, se considerassemos apenas as 49 primeiras observances dos dados de compri- 
mento do espinho, a mediana seria a 25 J observanao (0,248). Porem, com um nume¬ 
ro par de observances, a mediana e defmida como o ponto central entre («/ 2 )-esima 
e [(n/ 2 )+l]-esima observanao. Se considerassemos todas as 50 observanoes da Tabela 
3.1, a mediana seria a media entre a 25 a e a 26 d observanoes, ou 0,2485. 


Moda = 0,237 Mediana = 0,248 



Comprimento do espinho tibial (mm) 

Figura 3.2 Histograma dos dados dos espinhos tibiais da Tabela 3.1 (n = 50) ilustrando a media 
aritmetica, a mediana e a moda. A media e a expectativa dos dados, calculada como a media arit- 
metica das medidas conti'nuas. A mediana e 0 ponto central do conjunto de observanoes ordenado. 
Metade de todas as observanoes e maior que a mediana e a outra metade e menor. A moda e a 
observanao mais frequente. 
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A moda, por outro lado, e o valor das observances que ocorre mais frequente- 
mente na amostra. A moda pode ser vista com facilidade em um histograma dos 
dados, ja que ela e o pico. A Figura 3.2 ilustra a media aritmetica, a mediana e a 
moda em um histograma com os dados dos espinhos tibiais. 

Quando usar cada medida de posi^ao 

Por que escolher uma medida de posinao em vez de outra? A media aritmetica 
(Equanao 3.1) e a medida de posinao mais utilizada, em parte por ser familiar. 
A justificativa mais importante e que o Teorema do Limite Central (Capitulo 2) 
mostra que as medias aritmeticas de amostras grandes provenientes de variaveis 
aleatorias obedecem a uma distribuinao normal, ou gaussiana, mesmo que a va- 
riavel aleatoria subjacente nao obedena. Essa propriedade torna facil testar hipo- 
teses sobre medias aritmeticas. 

A media geometrica (Equates 3.4 e 3.5) e mais apropriada para descrever 
processos multiplicativos, como as taxas de crescimento populacional ou clas¬ 
ses de abundancia de especies (antes elas sao transformadas logaritmicamente; 
ver discussao da distribuinao log-normal no Capitulo 2 e discussao de trans- 
formanoes de dados no Capitulo 8). A media harmonica (Equa^ao 3.6) aparece 
em calculos usados por geneticistas de populates e biologos da conservanao. 

A mediana ou a moda descrevem melhor a posinao dos dados quando a dis¬ 
tribuinao das observances nao se ajusta a uma distribuinao de probabilidades pa- 
drao, ou quando existem observances extremas. Isso acontece porque as medias 
aritmetica, geometrica e harmonica sao muito sensiveis a observances extremas 
(grandes ou pequenas), enquanto a mediana e a moda tendem a cair no meio da 
distribuinao, independente da sua dispersao e forma. Em distributees simetricas, 
como a distribuinao normal, a media aritmetica, a mediana e a moda sao a mes- 
ma. Porem, em distributees assimetricas, como a da Figura 3.2 (uma amostra 
aleatoria relativamente pequena de uma distribuinao normal subjacente), a media 
ocorre em direnao a maior cauda da distribuinao; a moda, na parte mais pesada da 
distribuinao e a mediana, entre ambas. 4 

MEDIDAS DE DISPERSAO 

Nao basta declarar a media ou outra medida de posinao. Como ha varianao na 
natureza, e porque ha um limite para a precisao com que conseguimos fazer me- 


4 As pessoas tambem usam diferentes medidas de posinao para defender diferentes pontos de vista. 
Por exemplo, a renda familiar media nos Estados Unidos e consideravelmente maior que a tipica (ou 
mediana). Isto porque a renda tern uma distribuinao log-normal, de modo que as medias sao ponde- 
radas pela longa cauda a direita da curva, representando os muito ricos. Tenha muita aten^ao quando 
a media, a mediana ou a moda de um conjunto de dados e reportada, e desconfie se ela for reportada 
sem uma medida de dispersao ou varianao. 
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didas, tambem e preciso quantificar e publicar a dispersao, ou variabilidade, de 
nossas observances. 

A variancia e o desvio-padrao 

O conceito de variancia foi apresentado no Capitulo 2 . Para uma variavel alea- 
toria Y, a variancia C 2 {Y) e uma medida de quanto as observances dessa variavel 
diferem do valor esperado. A variancia e definida como E[Y-E(Y)] 2 , onde E(Y) 
e o valor esperado de Y. Com a media, a variancia real de uma populanao e uma 
quantidade desconhecida. Da mesma forma que calculamos a Y estimada da me¬ 
dia da populanao |i usando nossos dados, podemos calcular a s' estimada da va¬ 
riancia da populanao CT usando: 

5 2 =^ X (y '- ? ) 2 (3 - 7) 

Este valor tambem e chamado de media quadrada. Tal termo e seu acompa- 
nhante, a soma dos quadrados, 


SQy=±(Y,-Y ) 2 (3.8) 

1=1 

vao surgir novamente quando discutirmos regressao e analise de variancia 
nos Capitulos 9 e 10 . E tal como definimos o desvio-padrao a de uma variavel 
aleatoria, como a raiz quadrada (positiva) de sua variancia, podemos estima-lo 
como s = y s 2 . A transformanao pela raiz quadrada garante que as unidades do 
desvio-padrao sao as mesmas que as da media. 

Notamos anteriormente que a media aritmetica Y fornece uma estimativa 
imparcial da p. Com isso queremos dizer que se amostrarmos a populanao repe- 
tidamente (infmitas vezes) e calcularmos a media aritmetica (independente do 
tamanho amostral), a grande media desse conjunto de medias aritmeticas deve se 
igualar a p. Contudo, nossas estimativas iniciais da variancia e do desvio-padrao 
nao sao estimadores imparciais da a 2 e do a, respectivamente. Em particular, a 
Equanao 3.7 subestima a variancia real da populanao. 

O vies da Equanao 3.7 pode ser ilustrado com um simples experimento ima- 
ginario. Suponha que voce tire uma unica observanao Y x de uma populanao e ten- 
te estimar a p e a CJ 2 (E). A sua estimativa da p e a media de suas observances, que, 
neste caso, e apenas Y v Porem, se voce estima a CT(y) usando a Equanao 3.7, sua 
resposta sempre sera 0 , 0 , pois sua unica observanao e a mesma que sua estimativa 
da media. O problema e que, com um tamanho amostral de 1 , ja usamos nosso 
dado para estimar p, e efetivamente nao temos nenhuma informanao adicional 
para estimar 0 2 (E). Isso leva diretamente ao conceito de graus de liberdade, ou 
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seja, o numero de pe^as de informa^oes independentes que temos em um con- 
junto de dados para estimar parametros estatisticos. Em um conjunto de dados 
de tamanho amostral 1, nao temos observances independentes o suficiente que 
possam ser utilizadas para estimar a variancia. 

A estimativa imparcial da variancia, tratada como variancia amostral, e cal- 
culada dividindo a soma dos quadrados por (n - 1) em vez de dividir por n. As- 
sim, a estimativa imparcial da variancia e: 

s 2 =-!-Y(Y,.-y) 2 (3.9) 

n — 


e a estimativa imparcial do desvio-padrao, tratada como desvio-padrao amos¬ 
tral/ e: 


s = 



(3.10) 


As Equates 3.9 e 3.10 ajustam os graus de liberdade para o calculo da va¬ 
riancia amostral e do desvio-padrao. As equates tambem ilustram a necessi- 
dade de realizar pelo menos duas observances para estimar a variancia de uma 
distribuinao. 

Para os dados dos espinhos tibiais da Tabela 3.1, s' - 0,0017 e s = 0,0417. 

0 erro-padrao da media 

Outra medida de dispersao, usada frequentemente por ecologos e cientistas da area 
ambiental, e o erro-padrao da media, a qual e abreviada como spee calculada pela 
divisao do desvio-padrao amostral pela raiz quadrada do tamanho amostral: 


s 


Y 



(3.11) 


A Lei dos Grandes Numeros prova que, para um numero infinitamente gran¬ 
de de observances, X Y/rc e uma aproximanao da media da populanao |l, onde Y n - 
{7;} e uma amostra de tamanho n de uma variavel aleatoria Y com valor esperado 


estimador imparcial do desvio-padrao e, por si so, imparcial apenas para amostras muito 
grandes (n > 30). Para tamanhos amostrais menores, a Equa^ao 3.10 tende a subestimar o valor 
do a da populanao (Gurland e Tripathi, 1971). Rohlf e Sokal (1995) fornecem uma tabela de con- 
sulta com o fator de corre^ao pelo qual s deve ser multiplicado caso n < 30. Na pratica, a maioria 
dos biologos nao aplica essas corre^oes. Se o tamanho amostral dos grupos que estao sendo corn- 
parados nao e muito diferente, nenhum problema grave acontece ao ignorar a corre^ao do s. 
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£(Y).De modo similar, a variancia de Y n = o 2 /n. Como o desvio-padrao e simples- 
mente a raiz quadrada da variancia, o de Y n e: 



que e o mesmo que o erro-padrao da media. Portanto, temos uma estimativa do 
desvio-padrao da media da populaqao |i, o erro-padrao. 

Infelizmente, alguns cientistas nao entendem a distin<;ao entre o desvio-pa¬ 
drao (abreviado em legendas de figuras como DP*) e o erro-padrao da media 
(abreviado como EP*). b Como o erro-padrao da media sempre e menor que 



Figura 3.3 Diagrama de barras mostrando a media aritmetica para os dados dos espinhos da 
Tabela 3.1 (n = 50), com barra de erro indicando o desvio-padrao amostral (barra esquerda) e o 
erro-padrao da media (barra direita). Enquanto o desvio-padrao mede a variabilidade de medidas 
individuais acerca da media, o erro-padrao mede a variabilidade da estimativa da media por si so. 
0 erro-padrao se iguala ao desvio-padrao dividido por ~Jn, entao ele sempre sera menor que o 
desvio-padrao, muitas vezes consideravelmente. As legendas e os textos de figuras devem sempre 
fornecer o tamanho amostral e indicar claramente quando o desvio-padrao ou o erro-padrao foi 
usado para construir as barras de erros. 


'"Voce deve ter notado que nos referimos ao erro-padrao da media e nao simplesmente ao erro-pa¬ 
drao. O erro-padrao da media e o mesmo que o desvio-padrao de um conjunto de medias. Simi- 
larmente, podemos calcular o desvio-padrao de um conjunto de variancias ou de outra estatistica 
descritiva. Apesar de ser incomum ver outros erros-padrao em publicacjoes da ecologia e ciencias 
ambientais, pode haver casos em que sera necessario reportar, ou no minimo considerar, outros 
erros-padrao. Na Figura 3.1, o erro-padrao da mediana = 1,2533 x Sy, e o erro-padrao do desvio- 
-padrao = 0,7071 x s r Sokal e Rohlf (1995) fornecem formulas para o erro-padrao de outras esta- 
tisticas comuns. 

* N. de T. Em ingles SD, para abreviar “Standard Deviation”; SE, para abreviar “Standard Error”. 
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o desvio-padrao amostral, as medias reportadas com o erro-padrao parecem 
menos variaveis que as reportadas com o desvio-padrao (Figura 3.3). Contudo, 
a decisao de quando apresentar o desvio-padrao amostral s ou o erro-padrao da 
media Sy depende de qual inferencia voce quer que o leitor fa<;a. Se suas conclu- 
sCes, com base em uma unica amostra, sao representativas da populanao inteira, 
reporte o erro-padrao da media. Por outro lado, se as conclusoes sao limitadas 
as amostras que temos, e melhor reportar o desvio-padrao amostral. Pesqui- 
sas observacionais amplas cobrindo grandes escalas espaciais com um numero 
significativo de amostras provavelmente sao representativas da populanao de 
interesse como um todo (por consequencia, reporte o Sy), enquanto experimen- 
tos pequenos e controlados, com poucas replicas, provavelmente sao baseados 
em um grupo unico (e possivelmente pouco representative) de individuos (por 
consequencia, reporte o s). 

Defendemos a ideia de reportar o desvio-padrao, s, que reflete com mais acu- 
racia a variabilidade subjacente dos dados reais e da menos credito a generalidade. 
No entanto, ao passo que voce fornece o tamanho amostral no texto, na figura ou 
na legenda da figura, os leitores podem calcular o erro-padrao da media a partir 
do desvio-padrao e vice-versa. 

Assimetria {skewness), curtose e momento central 

O desvio-padrao e a variancia sao casos especiais daquilo que os estatisticos (e 
fisicos) chamam de momento central (MC). O MC e a media do desvio de todas 
as observances em um conjunto de dados da media das observances, elevado a 
potencia r: 


MC = j i f d (Y l -Y)' 

i=\ 


(3.12) 


Na Equanao 3.12, n e o numero de observances, Y) e o valor de cada observa- 
nao individual, Yea media aritmetica das n observances ere um inteiro positivo. 
O primeiro momento central (r = 1) e a soma das diferennas entre cada obser- 
vanao menos a media amostral (aritmetica), que sempre e igual a 0. O segundo 
momento central (r = 2) e a variancia (Equanao 3.5). 

O terceiro momento central (r = 3), dividido pelo desvio-padrao elevado ao 
cubo (s 3 ), e chamado de assimetria (denotada como g,): 




ns 


i =1 


(3.13) 


A assimetria descreve como a amostra difere em forma de uma distribui- 
nao simetrica. Uma distribuinao normal tern = 0. Uma distribuinao em que 
g, > 0 tern assimetria a direita: ha uma longa cauda de observances maiores 
(i. e., a direita da) que a media. Em contraste, g, < 0 tern assimetria a esquerda: 
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Figura 3.4 Distribuinao contmua ilustrando a assimetria (g,)- A assimetria mede a extensao 
na qual a distribuigao e assimetrica, com uma longa cauda de probabilidades a direita ou a 
esquerda. A curva verde e a distribuinao log-normal ilustrada na Figura 2.8; ela tern assimetria 
positiva, com muito mais observances a direita da media do que a esquerda (uma longa cauda 
a direita), e uma medida de assimetria de 6,9. A curva preta representa uma amostra de 1.000 
observances de uma variavel aleatoria normal com media e desvio-padrao identicos aos da dis¬ 
tribuinao log-normal. Como esses dados foram tirados de distributes normais simetricas, eles 
tern aproximadamente o mesmo numero de observances em cada lado da media e a assimetria 
medida e aproximadamente 0. 


ha uma longa cauda de observances menores (i. e., a esquerda da) que a media 
(Figura 3.4). 

A curtose tern sua base no quarto momento central (r = 4): 



(3.14) 


A curtose mede a extensao na qual a densidade de probabilidade e distribuida 
nas caudas versus o centro da distribuinao. Distributes agregadas ou platicurti- 
cas tern g 2 < 0; comparado a distribuinao normal, existe mais massa de probabili¬ 
dade no centro da distribuinao e menos probabilidade nas caudas. Em contraste, 
distributes leptocurticas tern g 2 > 0. As distributes leptocurticas tern menos 
massa de probabilidade no centro e caudas de probabilidades relativamente pesa- 
das (Figura 3.5). 

Apesar da assimetria e da curtose terem sido reportadas com frequencia na 
literatura ecologica antes da metade dos anos 1980, e incomum, na atualidade, ver 
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Figura 3.5 Distributes ilustrando curtoses (g 2 ). A curtose mede a extensao na qual a distribui- 
$ao e de cauda-pesada ou de cauda-leve, quando comparadas a uma distributo normal padrao. 
Distributes com caudas-pesadas sao leptocurticas e contem relativamente mais area nas caudas 
da distributo e menos no centro. Distributes leptocurticas possuem valores positivos para g 2 . 
Distributes com caudas-leves sao platicurticas e contem relativamente menos area nas caudas 
da distributo e mais no centro. Distributes platicurticas tern valores negativos para g 2 . A curva 
preta representa uma amostra com 1.000 observances de uma variavel aleatoria normal com media 
0 e desvio-padrao 1 (X~ N(0,1));sua curtose e proxima deO. A curva verde e uma amostra de 1.000 
observanoes de uma distributo t com 3 graus de liberdade. A distributo f e leptocurtica e tern 
curtose positiva (g 2 = 6,05 neste exemplo). 


esses valores reportados. Suas propriedades estatisticas nao sao boas: sao muito 
sensiveis a medidas discrepantes ( outliers ) e a diferen<;as na media da distribuiqao. 
Weiner e Solbrig (1984) discutem o problema de usar medidas de assimetria em 
estudos ecologicos. 


Quantis 

Outra forma de ilustrar a dispersao de uma distributo e reportar os quantis. Es- 
tamos todos familiarizados com um tipo de quantil, o percentil, por causa de seu 
uso em testes padronizados. Quando o escore de um teste e reportado dentro do 
90° percentil, 90% dos escores sao menores que aquele que foi reportado, e 10% 
sao maiores. Neste capitulo vimos outro exemplo de um percentil - a mediana, 
que e o valor localizado no 50° percentil dos dados. Em apresentanoes de dados 
estatisticos reportamos mais comumente o quartil superior e o inferior - os va¬ 
lores do 25° e do 75° percentil, e o decil superior e o inferior - os valores do 10° e 
do 90° percentil. Esses valores para os dados dos espinhos sao ilustrados, de for¬ 
ma concisa, em um box plot (Figura 3.6). Ao contrario da variancia e do desvio- 
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Figura 3,6 Box plot ilustrando os quantis dos dados da Tabela 3.1 (n = 50). A linha indica o 50° 
percentil (mediana) e a "caixa"engloba 50% dos dados, a partirdo 25° ate o 75° percentil. As linhas 
verticals se estendem do 10° ao 90° percentil. 


-padrao, os valores dos quantis nao dependem dos valores da media aritmetica 
ou da mediana. Quando as distributes sao assimetricas ou possuem medidas 
discrepantes - outliers (dados com valores extremos que nao sao caracteristicos 
da distribui^ao da qual foram amostrados, ver Capitulo 8), os box plots dos quan¬ 
tis podem retratar a distribui<;ao dos dados de forma mais acurada que graficos 
convencionais de media e desvio-padrao. 

Usando as medidas de dispersao 

Por si so, as medidas de dispersao nao sao especialmente informativas. A sua 
utilidade primaria e para comparar dados de diferentes populates aos de dife- 
rentes tratamentos dentro de experimentos. Por exemplo, a analise de variancia 
(Capitulo 10) usa os valores da variancia amostral para testar hipoteses de que 
os tratamentos experimentais diferem uns dos outros. O conhecido teste -1 usa o 
desvio-padrao amostral para testar hipoteses de que as medias de duas popula¬ 
tes diferem uma da outra. Nao e simples comparar apenas a variabilidade sobre 
populates ou grupos de tratamentos, porque a variancia e o desvio-padrao de¬ 
pendem da media amostral. Contudo, descontando o desvio-padrao pela media, 
podemos calcular uma medida independente de variabilidade, chamada de coefi- 
ciente de varia«;ao, ou CV. 

O CV e o desvio-padrao amostral dividido pela media, s/7, e e convencio- 
nalmente multiplicado por 100 para dar a porcentagem. O CV para os dados dos 
espinhos = 16,5%. Se outra popula^ao de aranhas tinha um CV do comprimento 
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do espinho tibial = 25%, poderiamos dizer que a primeira popula^ao e menos 
variavel que a segunda popula^ao. 

Um indice parecido e o coeficiente de di^persao, que e calculado atraves da 
divisao da variancia amostral pela media ( s 2 /Y ). O coeficiente de dispersao pode 
ser usado com dados discretos para avaliar quando os individuos estao agregados 
ou hiper-dispersos no espa^o, ou quando estao dispersos de maneira aleatoria, 
como predito pela distribui<;ao de Poisson. Fo^as biologicas que violam a inde¬ 
pendence farao com que as distributes observadas sejam diferentes daquelas 
preditas pela de Poisson. 

Por exemplo, algumas larvas de invertebrados marinhos exibem uma respos- 
ta a fixa^ao agregada: uma vez que um juvenil ocupa uma mancha, ela se torna 
muito atrativa enquanto superficie de fixa^ao para as larvas subsequentes (Crisp, 
1979). Comparada a uma distribui^ao de Poisson, essas distributes agregadas 
ou amontoadas tenderao a ter muitas amostras com alto numero de ocorrencia 
e muitas outras com zero ocorrencia. Em contraste, muitas colonias de formigas 
exibem forte territorialidade e matam ou expulsam outras que tentem estabelecer 
colonias dentro do territorio (Levings e Traniello, 1981). Esse comportamento 
de segrega^ao tambem puxa a distribui<;ao para fora da de Poisson. Neste caso, as 
colonias serao hiperdispersas: havera poucas amostras na classe de frequencia 0 e 
outras poucas com alto numero de ocorrencias. 

Como a variancia e a media de uma variavel aleatoria de Poisson se igualam a 

X, o coeficiente de dispersao (CD) para uma variavel aleatoria de Poisson = XIX = 1. 
Por outro lado, se os dados sao amontoados ou agregados, CD > 1,0, e se os dados 
sao hiperdispersos ou segregados, CD < 1,0. Contudo, a analise do padrao espa- 
cial com distribui^ao de Poisson pode se tornar complicada, porque os resultados 
dependem nao somente do grau de agrega^ao, ou segrega^o dos organismos, 
como tambem do tamanho, do numero e da coloca^o das unidades amostrais. 
Hulbert (1990) discute alguns dos temas envolvidos em ajustes de dados espaciais 
a distribui^ao de Poisson. 

ALGUMAS QUESTOES FILOSOFICAS EM T0RN0 DAS ESTATISTICAS DESCRITIVAS 

As estatisticas descritivas fundamentals - a media amostral, o desvio-padrao e 
a variancia - sao estimativas dos parametros reais no nivel de popula<;ao, p, a e 
a 2 que obtemos diretamente a partir dos dados. Como e impossfvel amostrar a 
popula^ao inteira, somos for^ados a estimar esses parametros desconhecidos pela 

Y, s, s 2 . Fazendo isso, atingimos um pressuposto fundamental: que existe um valor 
fixo e verdadeiro para cada um desses parametros. A Lei dos Grandes Numeros 
prova que, se amostrarmos uma popula<;ao infinitas vezes, a media dos muitos Y's 
que calcularmos a partir de nossas amostras se igualaria a |i. 

A Lei dos Grandes Numeros forma os alicerces daquilo que passou a ser 
conhecido como estatistica parametrica, frequentista, ou assintotica. A 
estatistica parametrica e assim chamada por causa do pressuposto de que a 
variavel medida pode ser descrita por uma aleatoria ou uma distributo de 
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probabilidade, de forma conhecida e com parametros fixos definidos. As esta- 
tisticas, frequentista e assintotica, sao assim chamadas porque assumimos que 
se o experimento for repetido muitas vezes, as estimativas mais frequentes dos 
parametros poderiam convergir em (atingir uma assintota em) seus valores 
verdadeiros. 

Mas e se esse pressuposto fundamental - de que os parametros subjacentes 
possuem valores verdadeiros e fixos - for falso? Por exemplo, se nossas amos- 
tras foram realizadas em um periodo longo de tempo, poderia haver mudan<;as 
no comprimento dos espinhos das tibias das aranhas por causa de plasticidade 
fenotipica no crescimento, ou mesmo mudan^a evolucionaria devido a sele^ao 
natural. Ou, talvez nossas amostras tenham sido realizadas em um periodo cur- 
to de tempo, mas cada aranha tenha vindo de um micro-habitat distinto, para 
os quais existe uma linica expectativa e variancia para comprimento da tibia. 
Nesse caso, existe algum significado real para um unico valor da estimativa do 
comprimento medio de um espinho tibial? A estatistica bayesiana parte do pres¬ 
suposto fundamental de que parametros no nivel de populaqio, como p, a, a 2 , 
sao, por si so, variaveis aleatorias. Uma analise bayesiana produz estimativas nao 
apenas dos valores dos parametros, mas tambem da variabilidade inerente des¬ 
ses parametros. 

A distin^ao entre as abordagens frequentista e bayesiana esta longe de ser 
trivial, e resultou em muitos anos de debates acrimoniosos, primeiro entre es- 
tatisticos e mais recentemente entre ecologos. Como veremos no Capitulo 5, as 
estimativas bayesianas de parametros como variaveis aleatorias frequentemente 
requerem complexos calculos de computador. Em contraste, estimativas fre- 
quentistas de parametros, como valores fixos, usam formulas simples, as quais 
esbo^amos neste capitulo. Devido a complexidade computacional das estimati¬ 
vas bayesianas, no inicio era dificil saber quando os resultados de analises fre- 
quentistas e bayesianas seriam quantitativamente diferentes. Contudo, o avan^o 
tecnologico permitiu executar analises bayesianas complexas. Sob certas condi- 
^bes, o resultado dos dois tipos de analises e quantitativamente similar. A deci- 
sao de qual tipo utilizar, portanto, deve basear-se mais por um ponto de vista 
filosofico que pelo resultado quantitative (Ellison, 2004). Entretanto, a interpre- 
ta«;ao dos resultados estatisticos pode ser completamente diferente entre ambas 
as perspectivas. Um exemplo dessa diferen<;a e a constru^ao e interpreta<;ao dos 
intervalos de confian^a para a estimativa de parametros. 

INTERVALOS DE CONFIAN^A 

Os cientistas frequentemente usam o desvio-padrao amostral para construir um 
intervalo de confian^a ao redor da media (Figura 3.1). Para uma variavel alea- 
toria que segue a distribui<;ao normal, aproximadamente 67% das observances 
ocorrem dentro de ± 1 desvios-padrao da media, e, em media, 96% ocorrem den- 
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tro de ± 2 desvios-padrao da media.' Usamos essa observa^ao para criar um inter- 
valo de confian^a de 95%, o que para amostras grandes e o intervalo delimitado 
por (7 - l,96Sy, Y + l,96Sy). O que este intervalo representa? Ele significa que a 
probabilidade de que a verdadeira media da popula<;ao p caia dentro do intervalo 
de confian<;a = 0,95. 


P(Y - 1 ,96Sy < p < Y + 1,96Sy ) = 0,95 (3.15) 


Como a nossa media amostral e o desvio-padrao amostral da media sao 
derivados de um unico exemplar, o intervalo de confianqa mudara se testar- 
mos a popula<;ao novamente (mas se o metodo e aleatorio e sem vies, nao de- 
veria mudar muito). Assim, essa expressao esta afirmando que a probabilidade 
de que a verdadeira media da popula^o p caia dentro de um unico intervalo 
de confian^a calculado = 0,95. Consequentemente, se formos amostrar repe- 
tidas vezes a popula«;ao (mantendo o tamanho amostral constante), 5% das 
vezes poderiamos esperar que a verdadeira media p ficasse fora do intervalo 
de confianqa. 

Interpretar um intervalo de confian«;a e complicado. Uma interpreta^ao 
erronea e “Existe 95% de chance de que a verdadeira media da popula<;ao p 
ocorra dentro desse intervalo”. O intervalo de confian^a contem ou nao con- 
tem p; diferente do gato quantico de Schrodinger (ver Nota de rodape 9, Ca- 
pitulo 1), p nao pode estar simultaneamente dentro e fora do intervalo de 
confian^a. O que voce pode dizer e que, em 95% das vezes, um intervalo calcu¬ 
lado desta forma ira conter o valor fixo de p. Desta forma, se voce realizar seu 
experimento 100 vezes, e criar 100 intervalos de confian^a, aproximadamente 
95 deles irao conter p e 5 nao (ver Figura 3.1 para um exemplo de quando um 
intervalo de confian<;a de 95% nao inclui a verdadeira media da popula^ao). 
Blume e Royal (2003) fornecem exemplos adicionais e uma descri<;ao pedago- 
gica mais detalhada. 

Esta explica^ao bastante complicada nao e satisfatoria, e nao e exatamente o 
que voce gostaria de afirmar quando construir um intervalo de confian^a. Intui- 
tivamente, voce diria o quanto esta confiante de que a media esta dentro do inter¬ 
valo (i. e., voce esta 95% certo de que a media esta no intervalo). Um estatistico 


7 Use a “regra dos dois desvios-padrao” quando ler a literatura cientifica e tome por habito rapida- 
mente estimar intervalos de confian^a grosseiros para dados amostrais. Por exemplo, suponha que 
voce le em um artigo que a media do conteudo de nitrogenio de uma amostra de tecidos de plantas 
foi de 3,4% ± 0,2, sendo 0,2 e o desvio-padrao amostral. Dois desvios-padrao = 0,4, valor que e entao 
somado e subtraido da media. Portanto, aproximadamente 95% das observances foram entre 3,0% 
e 3,8%. Voce pode usar essa mesma dica quando examinar graficos de barras, nos quais o desvio- 
-padrao e representado como barra de erro. Eis uma excelente forma de usar estatisticas descritivas 
para verificar no ato as diferen^as estatisticas reportadas entre grupos. 
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frequentista, contudo, nao pode afirmar isso. Se existe uma media p fixa da popu- 
la^ao, ou ela esta ou nao esta dentro do intervalo e a declara^ao da probabilidade 
(Equa^ao 3.15) afirma a probabilidade desse intervalo de confian 9 a de incluir p. 
Por outro lado, um estatistico bayesiano se refere a intervalos de credibilidade, 
para distingui-lo do intervalo de confian^a frequentista. Ver Capitulo 5 e Ellison 
(1996) para detalhes adicionais. 

Intervalos de confian^a generalizados 

Podemos construir qualquer intervalo de confian^a com base nos percentis, como 
de 90%, ou de 50%. A formula geral para um n% intervalo de confian^a e: 

P(Y-t a[n _ l] Sy<f.i < Y +f ft|n _ 1] sp) = (l-a) (3.16) 

onde e o valor critico de uma distribui<;ao-f com probabilidade P = a, e 
tamanho amostral n. Essa probabilidade expressa a percentagem de area sob as 
duas caudas da curva de uma distribui^ao-f (Figura 3.7). Para uma curva normal 
padrao (uma distribui^ao-f com n = 95% da area sob a curva esta dentro de 

±1,96 desvio-padrao da media. Deste modo, 5% da area (P = 0,05) sob a curva 
permanecem nas duas caudas para alem dos pontos a ± 1,96. 

Entao o que e a distribui<;ao-f? Relembre do Capitulo 2 que uma transforma- 
^ao aritmetica de uma variavel aleatoria normal e, po_r si so, uma variavel aleatoria 
normal. Considere o conjunto de medias amostrais {YJ resultante de um conjun- 
to de grupos de medidas replicadas de uma variavel aleatoria normal com media 
p desconhecida. O desvio das medias amostrais da media da popula^ao Y k - p 
tambem e uma variavel aleatoria normal. Se essa ultima variavel aleatoria ( Y k - p) 
for dividida pelo desvio-padrao, a, da popula^ao, ainda desconhecido, o resultado 
e uma variavel aleatoria normal padrao (media = 0, desvio-padrao =1). Contudo, 
nao sabemos o desvio-padrao a da popula<;ao, e precisamos, em vez disso, dividir 
os desvios de cada media pela estimativa do erro-padrao da media de cada amos- 
tra (syj. A distribui<;ao-f resultante e similar, mas nao identica a uma normal 
padrao. Essa distribui^ao-t e leptocurtica, com caudas mais longas e pesadas que 
uma normal padrao. 8 


s Este resultado foi primeiramente demonstrado pelo estatistico W.S. Gossett, que o publicou usan- 
do o pseudonimo “Student”. Naquele tempo, Gosset, estava empregado na cervejaria Guinness, que 
nao permitia que seus empregados publicassem segredos comerciais, e, por isso, precisava de um 
pseudonimo. Esta distribui^ao normal padrao modificada, chamada por Gossett de distribui<;ao-f, 
tambem e conhecida como “distribui^ao-f de Student”. Conforme o numero de amostras aumenta, 
a forma da distribui<;ao-f se aproxima da distribuii^ao normal padrao. A construcao da distribui- 
^ao-f requer a especifica^ao do tamanho amostral nee normalmente escrita como /:,,. Para n = °°, 

f H ~ N(0,1). 

Como a distribuiaio-f para um n pequeno e leptocurtica (ver Figura 3.5), a largura do intervalo 
de confian^a construldo a partir dela ira se estreitar conforme o tamanho amostral aumenta. Por 
exemplo, para n - 10,95% da area sob a curva caem entre ±2,228. Para n- 100,95% da area sob a 
curva caem entre +1,990.0 intervalo de confian^a resultante e 12% mais largo para n = 10 que para 
n = 100. 
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Figura 3.7 Distribuigao-f ilustrando que 95% das observances, ou massa de probabilidade, caem 
dentro do percentil de±1,96 desvio-padrao da media (media = 0). As duas caudas da distribuiqao 
contem cada 2,5% das observances ou massa de probabilidade da distribuigao. Elas somam 5% das 
observances, e a probabilidade P = 0,05 de que uma observagao caia nessas caudas. Esta distribui- 
nao e identica a distribuinao-f ilustrada na Figura 3.5. 


RESUMO 


Estatisticas descritivas descrevem os valores esperados e a variabilidade de uma 
amostra aleatoria de dados. Medidas de posinao incluem a mediana, a moda e di- 
versas medias. Se as amostras sao aleatorias ou independentes, a media aritmetica 
e um estimador imparcial do valor esperado de uma distribui<;ao normal. As me¬ 
dias geometrica e harmonica tambem sao utilizadas em circunstancias especiais. 
Medidas de dispersao incluem a variancia, o desvio-padrao e o erro-padrao, e os 
quantis. Essas medidas descrevem a varianao das observances acerca do valor es¬ 
perado. Medidas de dispersao tambem podem ser utilizadas para construir inter¬ 
vals de confianna ou de credibilidade. As interpretanoes desses intervalos diferem 
entre os estatisticos frequentistas e bayesianos. 










< 


> 


4 

Formulando e 
Testando Hipoteses 


H ipoteses sao explica^oes potenciais que podem representar nossas ob¬ 
servances do mundo externo. Em geral, elas represenlam relates de 
“causa e efeito” entre um mecanismo ou processo proposto (a causa) e nossas 
observances (o efeito). Observances sao dados - aquilo que vemos ou medimos 
no mundo real. Nosso objetivo em realizar um estudo cientifico £ entender a(s) 
causa(s) de fenCmenos observdveis. Coletar observances £ um meio para este 
fim: acumulamos diversos tipos de observances e as usamos pra distinguir en¬ 
tre diferentes causas possiveis. Alguns cientistas e estatisticos fazem uma distin- 
nao entre observances realizadas durante experimentos manipulativos daque- 
las realizadas durante estudos observacionais ou correlacionais. Contudo, na 
maioria dos casos, o tratamento estatistico desse tipo de dados £ identico. A 
distinnao recai sobre as inferencias' feitas com esses estudos. Experimentos 
manipulativos bem-delineados permitem que fiquemos bastante confiantes 
sobre nossas inferencias; temos menos confiann'a em dados de experimentos 
pobremente delineados, ou de estudos em que somos incapazes de manipular 
diretamente as varidveis. 

Se as observances sao o “que” da ciencia, as hipoteses sao o “como”. Enquanto 
as observances sao tiradas do mundo real, as hipoteses nao necessariamente o sao. 
Embora nossas observances possam sugerir hipCteses, as hipoteses tambem po¬ 
dem vir do corpo da literatura cientifica existente, das predinCes de modelos teo- 
ricos, e de nossa propria intuinao e raciocinio. Contudo, nem todas as descrinCes 
de relan'Ces de “causa e efeito” constituem hipoteses cientificas validas. Uma hi- 
potese cientifica deve ser testavel: em outras palavras, deve haver algum conjunto 


Em logica, uma inferencia e uma conclusao que e derivada de premissas. Cientistas fazem inferencias 
(tiram conclusoes) acerca de causas com base em seus dados. Essas conclusoes podem ser sugeridas 
ou implicadas pelos dados. Mas, lembre-se, e o cientista quern infere o que os dados indicam. 
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adicional de observances ou resultados experimentais que possamos coletar e que 
cause a modifica^ao, a rejei<;ao ou o descarte de nossa hipotese de trabalho. 2 Hi- 
poteses metafisicas, incluindo atividades de deuses onipotentes, nao se qualificam 
como cientificas porque essas explicates sao tiradas da fe, e nao ha observanoes 
que possam fazer um credulo rejeita-las. 3 

Alem de ser testavel, uma boa hipotese cientifica deve gerar novas predinoes, 
as quais podem ser testaveis atraves da coleta de mais observances. Contudo, o 
mesmo conjunto de observanoes pode ser predito por mais de uma hipotese. Em- 
bora as hipoteses sejam escolhidas para incorporar nossas observanoes iniciais, 
uma boa hipotese cientifica tambem deve fornecer um conjunto unico de pre- 
dinoes que nao surjam a partir de outras explicanoes. Ao manter o foco nessas 
predinoes unicas, podemos coletar com mais rapidez os dados criticos que irao 
discriminar entre as alternativas. 

METODOS CIENTIFICOS 

O “metodo cientifico” e a tecnica usada para decidir entre hipoteses com base em ob¬ 
servances e predinoes. A maioria dos livros-texto apresenta apenas um metodo cien¬ 
tifico, mas cientistas praticantes, na verdade, usam varios metodos em seu trabalho. 

Dedunao e indu^ao 

Dedunao e indunao sao dois importantes modos de raciocinio cientifico, e ambos 
envolvem fazer inferences a partir de dados ou modelos. A dedunao vai do caso 
geral para o especifico. O conjunto de afirmanoes a seguir fornece um exemplo de 
dedunao classica: 


2 Uma hipotese cientifica refere-se a um mecanismo particular ou rela^ao de “causa e efeito”; uma 
teoria cientifica e muito mais abrangente e mais sintetica. Em seus estagios iniciais, nem todos os 
elementos de uma teoria cientifica podem ser completamente articulados, de modo que hipoteses 
explicitas podem nao ser possiveis inicialmente. Por exemplo, a teoria da sele^ao natural de Darwin 
requeria um mecanismo de heran^a que conservasse as caracteristicas de uma gera^ao para a pro- 
xima e ao mesmo tempo mantivesse a varia^ao entre individuos. Darwin nao tinha uma explica<;ao 
para a heran^a, e ele discutia essa fraqueza de sua teoria em The Origin of Species (1859). Darwin 
nao sabia que tal mecanismo precisamente tinha de fato sido descoberto por Gregor Mendel em 
seus estudos experimentais (ca. 1856) sobre a heran<;a das ervilhas. Ironicamente, o avo de Darwin, 
Erasmus Darwin, havia publicado um trabalho sobre heran^a duas gera^oes antes, em seu Zoonomia , 
or the Laws of Organic Life (1794-1796). Contudo, Erasmus Darwin usou a planta boca-de-leao como 
seu organismo de estudo, enquanto Mendel usou ervilhas. A heran^a da cor das flores e mais simples 
em plantas de ervilhas que em bocas-de-leao, e Mendel pode reconhecer a natureza particulada dos 
genes, enquanto Erasmus Darwin nao. 

3 Embora muitas filosofias tenham tentado preencher as lacunas entre ciencia e religiao, a contra- 
di^ao entre a razao e a fe e uma linha de falha critica que as separa. Um dos primeiros filosofos 
do Cristianismo, Tertuliano (-155-222 d.C.) se utilizou dessa contradi^ao e afirmou “ Credo quai 
absurdum esf (“Creio porque e absurdo”). Na visao tertuliana, a morte do filho de Deus deve ser 
acreditada porque e um fato contraditorio; e ele ter levantado da tumba e um fato veridico, pois e 
impossivel (Reese, 1980). 
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1. Todas as formigas de Harvard Forest pertencem ao genero Myrmica. 

2. Eu amostrei esta formiga em particular em Harvard Forest. 

3. Esta formiga em particular e do genero Myrmica. 

As afirma^oes 1 e 2 geralmente sao tratadas como premissas maior e me- 
nor e a afirma^ao 3 e a conclusao. O conjunto de tres afirma^oes e chamado 
de silogismo, uma importante estrutura logica desenvolvida por Aristoteles. 
Note que a sequencia do silogismo decorre do caso geral (todas as formigas 
de Harvard Forest) para o caso especifico (a formiga em particular que foi 
amostrada). 

Em contraste, a indu^ao vai do caso especifico para o geral: 4 

1. Todas estas 25 formigas sao do genero Myrmica. 

2. Todas estas 25 formigas foram coletadas em Harvard Forest. 

3. Todas as formigas de Harvard Forest sao do genero Myrmica. 

Alguns filosofos definem a dedu^ao como uma inferencia certa e a indu^ao 
como uma inferencia provavel. Tais defini^oes certamente se ajustam ao exemplo 
das formigas coletadas em Harvard Forest. No primeiro conjunto de afirma^bes 
(dedu<;ao), a conclusao precisa ser logicamente verdadeira se as duas premissas 
sao verdadeiras. Mas no segundo caso (indu^ao), embora a conclusao seja prova- 
velmente verdadeira, tambem pode ser falsa; nossa confian^a ira aumentar com o 
tamanho da amostra, que e sempre o caso em inferencia estatistica. A estatistica, 
por natureza, e um processo indutivo: sempre tentamos tirar conclusoes gerais 
com base em amostras especificas e limitadas. 

Ambas, indu 9 ao e dedu^ao, sao utilizadas em todos os modelos de raciocinio 
cientifico, mas elas recebem diferentes enfases. Mesmo utilizando o metodo in¬ 
dutivo, provavelmente usaremos a dedu«;ao para derivar predi^oes especificas a 
partir das hipoteses gerais em cada volta do ciclo. 



Sir Francis Bacon 


4 0 defensor do metodo indutivo foi Francis Bacon (1561-1626), grande figura 
juridica, filosofica e politica da Inglaterra de Elizabeth. Ele era um membro proe- 
minente do parlamento, e foi nomeado cavaleiro em 1603. Entre os estudiosos que 
questionam a autoria dos trabalhos de Shakespeare (os chamados anti-stratfordia- 
nos), alguns acreditam que Bacon era o verdadeiro autor das pe^as de Shakespeare, 
mas as evidencias nao sao muito convincentes. O trabalho cientifico mais impor¬ 
tante de Bacon foi seu Novun Organum (1620), no qual ele incita o uso da indu^ao 
e do empiricismo como forma de conhecer o mundo. Esta foi uma importante 
quebra com o passado, em que a explora^ao da “filosofia natural” envolvia excessiva dependencia 
sobre a dedu^ao e em publica^oes de autoridades (particularmente os trabalhos de Aristoteles). O 
metodo indutivo de Bacon pavimentou o caminho para as importantes descobertas cientificas de 
Galileo e de Newton na Idade da Razao. Perto do fim de sua vida, a fortuna politica de Bacon teve 
uma reviravolta para pior: em 1621, ele foi removido do cargo por aceitar subornos. A devo^ao de 
Bacon ao empirismo algumas vezes o levou ao radicalismo. Na tentativa de testar a hipotese de que 
o congelamento desacelera a putrefa^ao da carne, Bacon se aventurou no frio durante o inverno de 
1626 para envolver uma galinha em neve. Ele ficou bastante prejudicado por esse ato e morreu pou- 
cos anos depois, aos 65 anos. 
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Qualquer indaga^ao cientifica come^a com uma observanao que tentamos ex- 
plicar. O metodo indutivo toma essa observanao e desenvolve uma unica hipotese 
para explica-la. Bacon enfatizava a importancia de usar os dados para sugerir a hi¬ 
potese, ao inves de invocar a sabedoria convencional, as autoridades reconhecidas 
ou as teorias filosoficas abstratas. Uma vez que a hipotese e formulada, ela gera 
- atraves de dedu^ao - predinoes adicionais. Essas predinoes sao, entao, testadas, 
coletando-se informa^oes adicionais. Se as novas observances se adequarem as 
predinoes, a hipotese e apoiada. Caso contrario, a hipotese precisa ser modificada 
para levar em conta as observances originais e as novas observances. Esse ciclo 
de hipotese-predinao-observanao e repetidamente reiniciado. Apos, a hipotese 
modificada deve se aproximar da verdade 1 ’ (Figura 4.1). 



Figura 4.1 0 metodo indutivo. 0 ciclo de hipotese, predinao e observanao e repetidamente reiniciado. A 

confirmanao de uma hipotese representa o ponto final teorico do processo. Compare o metodo indutivo ao 
hipotetico-dedutivo (Figura 4.4), em que multiplas hipoteses de trabalho sao propostas e a enfase e dada ao 
falseamento, ao inves da verificanao. 


5 Ecologos e cientistas da area ambiental recorrem a inducao quando usam programas estatisticos 
para ajustar iun^oes nao lineares (curvas) aos dados (ver Capi'tulo 9). Os programas requerem que 
especifique nao somente a equa<;ao a ser ajustada, mas tambem um conjunto de valores iniciais para 
os parametros desconhecidos. Esses valores iniciais necessitam estar “proximos” aos reais, pois os 
algoritmos sao estimadores locais (i. e., buscam solu^ao para o minimo ou maximo local da funcao). 
Portanto, se as estimativas iniciais estao “distantes” dos valores reais da funcao, as rotinas de ajuste 
da curva podem falhar em convergir para uma solu(;ao ou ira convergir a uma solu^ao sem sentido 
algum. Tracar a curva ajustada junto com os dados e uma boa medida de seguran^a para confirmar 
que a curva derivada pelos parametros estimados realmente se ajusta aos dados originais. 
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Duas vantagens do metodo indutivo sao (1) enfatizar a intima liga^ao en- 
tre dados e teoria; e (2) explicitamente construir e modificar hipoteses com base 
no conhecimento previo. O metodo indutivo e confirmatorio na medida em que 
buscamos dados que suportem a hipotese, para depois modificar a hipotese para 
confirmar os dados acumulados. 6 

Existem varias desvantagens no metodo indutivo. Talvez a mais seria e de 
que esse metodo considera somente uma hipotese inicial; outras hipoteses sao 
consideradas apenas depois, em resposta a observances adicionais. Se “partir- 
mos com o pe errado” e comenarmos explorando hipoteses equivocadas, pode- 
-se demorar muito para chegar a resposta correta pela indu<;ao. Em alguns 
casos podemos nunca chegar la. Alem disso, o metodo indutivo pode encorajar 
cientistas a terem hipoteses “de estima<;ao” e talvez ficarem com elas muito 
tempo antes de descarta-las ou modifica-las radicalmente (Loehle, 1987). E 
por fim, o metodo indutivo - pelo menos na visao de Bacon - deriva teo- 
rias exclusivamente a partir de observances empiricas. Contudo, muitas ideias 
teoricas importantes vieram de modelagem teorica, raciocinio abstrato, e da 
boa e velha intuinao. Hipoteses importantes em todas as ciencias frequente- 
mente surgiram em antecipanao a coleta dos dados criticos necessarios para 
testa-las. 7 

A indu^ao nos dias modernos: inferencia bayesiana 

A hipotese nula e o ponto inicial de uma investiganao cientifica, pois tenta ex- 
plicar os padroes nos dados da forma mais simples possivel, o que em geral sig- 
nifica atribuir, inicialmente, a varianao nos dados a aleatoriedade ou ao erro de 
medidas. Se essa simples hipotese nula pode ser rejeitada, podemos nos mover 


6 0 ecologo de comunidades Robert H. MacArthur (1930-1972) certa vez 
escreveu que o grupo de pesquisadores interessados em fazer da ecologia 
uma ciencia “organiza dados ecologicos como exemplos para testar as 
teorias propostas e passa a maior parte do tempo remendando teorias para 
explicar o maior numero de dados quanto possivel” (MacArthur, 1962). 
Essa cita^ao caracteriza muito do trabalho teorico inicial da ecologia de 
comunidades. Depois, a ecologia teorica se desenvolveu como disciplina 
por seus proprios meritos e algumas linhas de pesquisa interessantes flo- 
resceram sem qualquer referenda a dados ou ao mundo real. Os ecologos 
discordam acerca de quando um grande corpo de trabalho puramente teorico tern sido bom ou mal 
para a nossa ciencia (Pielou, 1981; Caswell, 1988). 

; Por exemplo, em 1931, o fisico austriaco Wolfgang Pauli (1900-1958) criou a hipotese da existencia 
do neutrino, uma particula eletricamente neutra com massa desprezivel, para explicar inconsisten¬ 
cy aparentes na conserva^ao de energia durante o decaimento radioativo. A confirma^ao empirica 
da existencia do neutrino nao aconteceu ate 1956. 
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para uma hipotese mais complexa.*' Como o metodo indutivo come^a com uma 
observa^ao que sugere uma hipotese, como gerar uma hipotese nula adequada? 
A inferencia bayesiana representa uma versao moderna e atualizada do metodo 



Figura 4.2 Duas hipoteses nulas para a rela^ao entre intensidade luminosa (medida como 
radia^ao fotossinteticamente ativa) e a taxa fotossintetica (medida como taxa de assimila^ao h- 
quida) em plantas. A hipotese nula mais simples e de que nao existe nenhuma associa^ao entre 
as duas variaveis (linha pontilhada). A hipotese nula e o ponto de partida para uma abordagem 
hipotetico-dedutiva que assume o conhecimento previo acerca da relagao entre as variaveis e e 
a base para urn modelo de regressao linear (Capitulo 9). Em contraste, a curva verde representa a 
abordagem bayesiana de trazer o conhecimento previo para criar uma hipotese nula informativa. 
Nesse caso, o "conhecimento previo" vem da fisiologia vegetal e da fotossintese. Esperamos que a 
taxa de assimila^ao cres^a rapidamente no comedo, conforme a intensidade luminosa aumenta, e 
entao atinja uma assintota, ou urn nivel de saturaqao. Tal rela^ao pode ser descrita pela equa^ao 
de Michaelis-Menten [Y = kX/(D + X)], que inclui os parametros para uma taxa de assimila^ao (k) 
assintotica e uma constante de meia-satura^ao (D) que controla a indina^ao da curva. Metodos 
bayesianos podem incorporar este tipo de informa^ao previa na analise. 


h A preferencia por hipoteses simples sobre as complexas tem uma longa 
historia na ciencia. O Principio da Parcimonia, de William de Ockham 
(1290-1349),declaraque“[Entidades] naodevem ser multiplicadasalem da 
necessidade”. Ockham acreditava que as hipoteses muito complexas eram 
vas e insultavam Deus. O Principio da Parcimonia tambem e conhecido 
como “Navalha de Ockham”, ou seja: a navalha apara a complexidade des- 
necessaria. Ockham viveu uma vida interessante: foi educado em Oxford 
e membro da Ordem Franciscana. Ele foi acusado de heresia em razao de 
alguns de seus escritos em sua tese de Mestrado. A acusa^ao foi mais tarde 
abandonada, mas quando o Papa Joao XXII desfiou a doutrina Franciscana a pobreza apostolica, 
Ockham foi excomungado e fugiu para a Bavaria. Morreu em 1349, provavelmente vitima da epi- 
demia da peste bubonica. 



Sir William de Ockham 
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indutivo. Os fundamentos da inferencia bayesiana podem ser ilustrados com 
um exemplo simples. 

A resposta fotossintetica das folhas ao aumento da intensidade de luz e um 
problema bem-estudado. Imagine um experimento em que cultivamos plantulas 
de mangue-vermelho, cada uma sob uma intensidade diferente de luz (expres- 
sa como densidade do fluxo de fotons fotossinteticos, ou DFFF, em fotons |imol 
por m 2 de tecido de folha exposta a luz por segundo) e medimos a resposta fotos¬ 
sintetica de cada planta (expressa como pmoles de C0 2 fixados por m 2 de tecido 
de folha exposto a luz por segundo). Entao representamos graficamente os dados 
com a intensidade da luz no eixo-x (a varidvelpreditora ) e a taxa fotossintetica no 
eixo-y (a varidvel resposta). Cada ponto representa uma folha diferente para a qual 
registramos esses dois numeros. 

Na ausencia de qualquer informa^ao acerca da relaqao entre a luz e a taxa fo¬ 
tossintetica, a hipotese nula mais simples e de que nao ha relaqao entre essas duas 
variaveis (Figura 4.2). Se ajustarmos uma linha a essa hipotese nula, a inclina^ao 
da linha seria 0. Se coletarmos dados e encontrarmos alguma outra rela^ao entre 
a disponibilidade de luz e a taxa fotossintetica, podemos, entao, usar esses dados 
para modificar nossa hipotese, seguindo o metodo indutivo. 

Porem, e realmente necessario formular a hipotese nula mesmo que nao 
tenhamos informa^ao nenhuma? Usando apenas um pouco de conhecimento 
acerca da fisiologia vegetal, podemos formular uma hipotese inicial mais realis- 
tica. Especificamente, esperamos que exista uma taxa fotossintetica maxima que 
a planta possa atingir. Alem desse ponto, o aumento na intensidade luminosa 
nao ira produzir fotossintese adicional, pois, algum outro fator, como a agua ou 
os nutrientes, se torna limitante. Mesmo que esses fatores sejam fornecidos e a 
planta seja cultivada sob condi<;6es otimas, a taxa fotossintetica ainda estara fora 
do nivel, porque existem limita^oes inerentes as taxas dos processos bioquimicos 
e a transference de eletrons que ocorre durante a fotossintese. (De fato, se con- 
tinuarmos aumentando a intensidade luminosa, o excesso de energia luminosa 
pode danificar o tecido das plantas e reduzir a fotossintese. Em nosso exemplo, 
porem, limitamos a amplitude superior da intensidade luminosa aquelas que a 
planta pode tolerar). 

Desse modo, nossa hipotese nula informada e de que a rela^ao entre a taxa 
fotossintetica e a intensidade luminosa deve ser nao linear, com uma assintota 
as grandes intensidades luminosas (ver Figura 4.2). Dados reais poderiam, en¬ 
tao, ser utilizados para testar o grau de suporte para essa hipotese mais realis- 
tica (Figura 4.3). Para determinar qual hipotese nula usar, tambem precisamos 
questionar qual, precisamente, e o ponto do estudo? A hipotese nula simples 
(equa^ao linear) sera apropriada se queremos apenas estabelecer que uma re- 
laqao nao aleatoria existe entre a intensidade luminosa e a taxa fotossintetica. 
A hipotese nula informada (equa^ao de Michaelis-Menten) sera apropriada se 
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Figura 4.3 Rela^ao entre a intensidade luminosa e a taxa fotossintetica. Os dados sao medidas 
da taxa de assimila^ao liquida e da radia^ao fotossinteticamente ativa para n = 15 folhas jovens 
da planta do mangue-vermelho Rhizophora mangle em Belize (Farnsworth e Ellison, 1996b). A 
equa^ao de Michaelis-Menten com a forma Y = kX/(D + X) foi ajustada aos dados. As estimativas 
dos parametros ±1 desvio-padrao sao k = 7,3 ±0,59 e D = 313 ±86,6. 


desejarmos comparar curvas de satura^ao entre especies ou testar modelos teo- 
ricos que fazem predit^oes quantitativas para a assintota ou para a constante de 
meia-satura<;ao. 

As Figuras 4.2 e 4.3 ilustram como um indutivista dos dias atuais, ou esta- 
tistico bayesiano, constroi uma hipotese. A abordagem bayesiana e de usar in- 
forma^ao ou conhecimento previo para gerar e testar hipoteses. Neste exemplo, 
o conhecimento previo e derivado da fisiologia vegetal e da forma esperada da 
curva de satura^ao luminosa. Contudo, o conhecimento previo tambem pode ser 
fundamentado na extensa base de literatura publicada sobre curvas de satura^ao 
luminosa (Bjorkman, 1981; Lambers et al., 1998). Se tivessemos estimativas empi- 
ricas de parametros de outros estudos, poderiamos quantificar nossas estimativas 
previas do valor limiar e da assintota para a satura^ao luminosa. Essas estimativas 
poderiam, entao, ser usadas para especificar a hipotese inicial sobre o ajuste do 
valor da assintota aos nossos dados experimentais. 

O uso de conhecimento previo dessa forma e diferente da de Bacon, da in- 
du<;ao, que se baseava inteiramente na propria experiencia do individuo. Em um 
universo baconiano, se voce nunca tiver estudado plantas, nao pode ter nenhu- 
ma evidencia direta sobre a rela^ao entre intensidade luminosa e taxa fotossinte¬ 
tica, e come^aria com uma hipotese nula, como a linha horizontal da Figura 4.2. 
Eis o ponto inicial do metodo hipotetico-dedutivo, que sera apresentado na pro- 
xima sessao. 
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A interpretanao estritamente baconiana da indu^ao e a base fundamental das 
criticas a abordagem bayesiana: o conhecimento previo utilizado para desenvol- 
ver o modelo inicial e arbitrario e subjetivo, e pode ser enviesada pelas nonCes 
preconcebidas do pesquisador. Desse modo, o metodo hipotetico-dedutivo e visto 
por alguns como sendo mais “objetivo” e, portanto, mais cientlfico. Os bayesianos 
rebatem o argumento, afirmando que a hipotese nula estatistica e as tecnicas de 
ajuste de curvas utilizadas por hipotetico-dedutivistas sao igualmente subjetivas; 
esses metodos apenas parecem ser mais objetivos por serem familiares e acritica- 
mente aceitos. Para uma discussao adicional desses temas filosoficos, ver Ellison 
(1996,2004) e Dennis (1996). 

0 metodo hipotetico-dedutivo 

O metodo hipotetico-dedutivo (Figura 4.4) desenvolveu-se a partir dos traba- 
lhos de Isaac Newton e outros cientistas do seculo XVII e foi defendido pelo 
filosofo da ciencia Karl Popper. 9 Como o metodo indutivo, o hipotetico-dedutivo 
come^a com uma observa<;ao inicial que estamos tentando explicar. Contudo, 
em vez de criar uma unica hipotese nula e prosseguir, esse metodo nos faz pro- 
por multiplas hipoteses de trabalho. Todas consideram a observa^ao inicial, mas 
cada uma faz predi^oes adicionais que podem ser testadas com experimentos e 
observances adicionais. O objetivo desses testes nao e confirmar, mas falsear as 
hipoteses. O falseamento elimina algumas explicates e a lista e reduzida a um 
numero menor de hipoteses competidoras. O ciclo de predinCes e novas obser¬ 
vances e repetido. O metodo hipotetico-dedutivo, porem, nunca confirma uma 
hipotese; a explicanao cientificamente aceita e a hipotese que resiste com sucesso 
a repetidas tentativas de falsea-la. 

As duas vantagens do metodo hipotetico-dedutivo sao: (1) ele forna a con- 
sideranao de multiplas hipoteses de trabalho desde o inicio; e (2) ele destaca 
as diferennas preditivas-chave entre elas. Em contraste ao metodo indutivo, 
as hipoteses nao necessitam ser construidas a partir de dados, mas podem ser 
desenvolvidas independentemente ou em paralelo a coleta de dados. A enfase 
no falseamento tende a produzir hipoteses simples e testaveis, de forma que as 



y O austriaco e filosofo da ciencia Karl Popper (1902-1994) foi o mais arti- 
culado defensor do metodo hipotetico-dedutivo e da falseabilidade como 
pedra-chave da ciencia. Em The logic of Scientific Discovery (1935), Popper 
demonstrou que a falseabilidade e um criterio mais confiavel do que a verifi- 
cabilidade. Em The open Science and Its Enemies (1945), ele defendeu a demo- 
cracia e criticou as implicates totalitarias da indu^ao e as teorias politicas de 
Platao e Karl Marx. 


Karl Popper 
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Figura 4.4 0 metodo hipotetico-dedutivo. Hipoteses multiplas de trabalho sao propostas e suas 
predi^oes sao testadas com o objetivo de falsear as incorretas. A explica^ao correta e aquela que se 
mantem depois de repetidos testes que falham em falsea-la. 


explicates mais cautelosas sao consideradas primeiro, e os mecanismos mais 
complicados por ultimo. 10 


10 A arvore da logica e uma variante bem conhecida do metodo hipotetico-dedutivo com a qual voce 
deve estar familiarizado dos cursos de quimica. A arvore da logica diz respeito a decisao dicotomica, 
em que diferentes ramos sao seguidos dependendo do resultado de experimentos em cada bifiirca^ao 
da arvore. A dica do ramo terminal representa as diferentes hipoteses que estao sendo testadas. A 
arvore da logica tambem pode ser encontrada nas familiares-chaves taxonomicas dicotomicas usadas 
para identificar especies de plantas ou animais desconhecidas: “Se o animal tern 3 pares de pernas 

(Continua) 
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As desvantagens do metodo hipotetico-dedutivo sao de que multiplas hipo- 
teses de trabalho nem sempre estao disponfveis, particularmente nos estagios ini- 
ciais da investiga^ao. Mesmo se multiplas hipoteses estiverem disponiveis, o me¬ 
todo nao funciona, a menos que a hipotese “correta” esteja entre as alternativas. 
Em contraste, o metodo indutivo pode come<;ar com uma hipotese incorreta, mas 
pode chegar a explica^ao correta atraves de repetidas modifica^oes da hipotese 
original, como consequencia da coleta de dados. Outra distin^ao util e que o me¬ 
todo indutivo ganha for<;a ao comparar muitos conjuntos de dados a uma unica 
hipotese, enquanto o metodo hipotetico-dedutivo e melhor para comparar um 
unico conjunto de dados a multiplas hipoteses. Por fim, ambos os metodos indu¬ 
tivo e hipotetico-dedutivo enfatizam uma unica hipotese correta, dificultando a 
avalia^ao de casos em que multiplos fatores estao atuando. Esse e um problema 
que afeta menos a abordagem indutiva, pois multiplas explicates podem ser in- 
corporadas a hipoteses mais complexas. 

Nenhum metodo cientifico e o correto, e alguns filosofos da ciencia negam 
que nenhum cenario realmente descreve como a ciencia opera. 11 Contudo, os 
metodos hipotetico-dedutivo e indutivo caracterizam muito da ciencia no mun- 
do real (em oposto ao mundo abstrato da filosofia da ciencia). A razao para 
investir tempo nesses modelos e para entender suas relates com os testes esta- 
tisticos de hipoteses. 


10 (Continuagao) 

locomotoras, va para o passo x; se ele tem 4 ou mais pares, va para o passo yV A arvore da logica nem 
sempre e pratica para hipoteses ecologicas complexas; pode haver excessivos ramos, e eles podem nao 
ser todos dicotomicos. Contudo, ela sempre e um excelente exerdcio para criar e expor suas ideias e 
seus experimentos em uma estrutura compreensivel. Platt (1964) defendeu esse metodo e apontou 
o seu sucesso espetacular na biologia molecular; a descoberta da estrutura helicoidal do DNA e um 
exemplo classico do metodo hipotetico-dedutivo (Watson e Crick, 1953). 

n Nenhuma discussao de Popper e do metodo hipotetico-dedutivo poderia 
ser completa sem mencionar a nemese filosofica de Popper, Thomas Kuhn 
(1922-1996). Em The Structure of Scientific Revolutions (1962), Kuhn colocou 
em questao toda a estrutura dos testes de hipoteses, e justificou que eles nao 
representam a forma como a ciencia foi concebida. Kuhn acreditava que ela 
havia sido concebida dentro do contexto de paradigmas principais, ou es- 
truturas de pesquisas, e que o dominio desses paradigmas foi implicitamente 
adotado em cada gera^ao de cientistas. As atividades dos cientistas de “solu- 
Thomas Kuhn cionar o quebra-cabe^a” constituem a “ciencia ordinaria”, na qual anomalias 

empiricas sao conciliadas aos paradigmas existentes. Entretanto, nenhum paradigma pode abranger 
todas as observances, e conforme as anomalias se acumulam, o paradigma se torna pouco efetivo. 
Eventualmente, ele entra em colapso e ha uma revolu^ao cientifica em que e substituido por um 
paradigma inteiramente novo. Assumindo uma instancia relativamente intermediary entre Popper e 
Kuhn, o filosofo Imre Lakatos (1922-1974) pensava que os programas de pesquisas cientificas (PPC) 
consistiam em um nucleo de principios centrais que geravam um cinturao de hipoteses subjacentes 
para fazer mais predi^oes especificas. As predi^oes de uma hipotese podem ser testadas por um me¬ 
todo cientifico, mas o nucleo nao e diretamente acessivel (Lakatos, 1978). Um paralelo entre Kuhn, 
Popper, Lakatos e outros filosofos da ciencia pode ser lido em Lakatos & Musgrave (1970). Ver tam- 
bem Horn (1986) para uma discussao adicional dessas ideias. 
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TESTANDO HIPOTESES ESTATISTICAS 

Hipotese estatistica versus retorno a hipotese cientifica 

O uso da estatistica para testar hipoteses e somente uma pequena faceta do meto- 
do cientifico, mas ele consome uma quantidade desproporcional do nosso tempo, 
bem como espa<;o em revistas. Usamos estatistica para descrever padroes em nos- 
sos dados, e depois testes estatisticos para decidir se as predi^oes de uma hipote¬ 
se sao suportadas ou nao. O estabelecimento de hipoteses, a articula<;ao de suas 
predi<;6es, o delineamento e a execu<;ao de experimentos validos, alem da coleta, a 
organiza^ao e a descri^ao dos dados ocorrem antes do uso dos testes estatisticos. 
Enfatizamos que aceitar ou rejeitar uma hipotese estatistica e bem diferente de 
fazer o mesmo com uma hipotese cientifica. A hipotese nula estatistica em geral e 
do tipo “nao ha padrao”, como nao ha diferen^a entre grupos, ou nao ha rela^ao 
entre duas variaveis continuas. Em contraste, a hipotese alternativa e de que o pa¬ 
drao existe. Em outras palavras, existem diferen<;as distintas em valores medidos 
entre grupos, ou uma rela^ao evidente existe entre duas variaveis continuas. Voce 
pode se questionar como esses padroes estao relacionados as hipoteses cientificas 
que voce esta testando. 

Por exemplo, imagine que voce esta avaliando a hipotese cientifica de que a 
arrebenta^ao de ondas na costa rochosa cria um espa 90 vazio em razao da remo- 
<;ao de especies de invertebrados competitivamente dominantes. O espa<;o aberto 
pode ser colonizado por especies competitivamente subordinadas que em outro 
caso seriam excluidas. Essa hipotese prediz que a diversidade de especies de inver¬ 
tebrados marinhos ira mudar em fun^o do nivel de disturbio (Sousa, 1979). Voce 
coleta dados sobre o numero de especies em superficies rochosas afetadas e nao 
afetadas por disturbios. Usando um teste de hipoteses adequado, voce observa 
que nao ha diferen^a na riqueza de especies entre os dois grupos. Neste caso, voce 
falhou em rejeitar a hipotese nula estatistica, e o padrao dos dados falhou em dar 
suporte a uma das predi^oes da hipotese de disturbios. Note, contudo, que a au- 
sencia de evidencia nao e evidencia de ausencia; falhar em rejeitar a hipotese nula 
nao e equivalente a aceitar a hipotese nula (apesar de frequentemente ser tratada 
como se fosse). 

Aqui esta um segundo exemplo no qual o padrao estatistico e o mesmo, mas 
a conclusao cientifica e diferente. A distribui^ao ideal livre e uma hipotese que 
prediz que os organismos se movem entre habitats e ajustam sua densidade de 
forma que tenha a mesma aptidao media em diferentes habitats (Fretwell e Lu¬ 
cas, 1970). Uma predi^ao testavel dessa hipotese e que a aptidao dos organismos 
em habitats diferentes e similar, mesmo pensando que a densidade da popula^ao 
possa diferir. Suponha que voce mede a taxa de crescimento populacional de pas- 
saros (um componente importante da aptidao de aves) em habitats de florestas e 
em descampados como um teste para esta predi^ao (Gill et al., 2001). Como no 
primeiro exemplo, voce falha em rejeitar a hipotese nula estatistica, e por isso nao 
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ha evidencia de que as taxas de crescimento diferem entre os habitats. Mas, nesse 
caso, falhar em rejeitar a hipotese nula estatistica de fato da suporte a predi^ao da 
distribui^ao ideal livre. 

Naturalmente, existem muitas observances adicionais e testes que podemos 
precisar para poder avaliar a hipotese do disturbio ou a distribui^ao ideal livre. 
O ponto e que as hipoteses estatistica e cientifica sao entidades distintas. Em 
qualquer estudo, e necessario determinar quando o ato de dar suporte ou refutar 
a hipotese nula estatistica fornece evidencia negativa ou positiva para a hipotese 
cientifica. Tal determina^ao tambem influencia profundamente a forma como 
voce estipula seu estudo experimental ou protocolo amostral para estudos obser- 
vacionais. A distin<;ao entre hipotese nula estatistica e a hipotese cientifica e tao 
importante que retornaremos a ela mais adiante neste capitulo. 

Significance estatistica e valores de P 

E praticamente universal reportar os resultados de um teste estatistico para 
afirmar a importancia dos padroes que observamos nos dados que coletamos. 
Uma afirma^ao tipica e: “Os grupos controle e o tratamento diferiram signi- 
ficativamente um do outro (P = 0,01)”. O que, precisamente, um “P = 0,01” 
significa, e como se relaciona aos conceitos de probabilidades apresentados nos 
Capitulos 1 e 2? 

Um exemplo hipotEtico: comparando mEdias Um problema de avalia^ao co¬ 
mum nas ciencias ambientais e determinar se as atividades humanas resultam em 
um aumento do estresse de animais. Em vertebrados, o estresse pode ser medido 
atraves dos niveis dos hormonios glicocorticoides (GC) no sangue ou nas fezes. 
Por exemplo, lobos que nao sao expostos a carros de neve tern 872,0 ng GC/g, 
enquanto os expostos a carros de neve tern 1.468,0 ng GC/g (Creel et al., 2002). 
Agora, como decidir se essa diferen^a e grande suficiente para ser atribuida a pre¬ 
sent^ dos carros de neve? 12 

Aqui e onde voce pode conduzir um teste estatistico convencional. Tais tes¬ 
tes podem ser muito simples (como o familiar teste-t), ou mais complexos (com 


1_ Muitas pessoas tentam responder esta questao simplesmente comparando as medias. Contudo, nao 
podemos avaliar a diferen^a entre medias a menos que tenhamos uma ideia do quanto os individuos 
dentro de um mesmo grupo diferem. Por exemplo, se muitos individuos do grupo sem carros de 
neve tern niveis de GC tao baixos quanto 200 ng/g e outros com niveis de GC tao altos quanto 1544 
ng/g (a media, lembre-se, foi de 872), entao uma diferen^a de 600 ng/g entre os dois grupos pode nao 
significar muito. Por outro lado, se a maioria dos individuos do grupo sem carros de neve tern niveis 
de GC entre 850 e 950 ng/g, entao uma diferen^a de 600 ng/g seria substancial. Como discutimos 
no Capitulo 3, precisamos saber nao somente a diferen^a entre as medias, mas a variancia acerca 
delas - a quantidade que um individuo tipico difere da media de seu grupo. Sem saber algo sobre a 
variancia nao podemos dizer nada sobre se as diferen<;as entre as medias dos dois grupos tern algum 
significado. 
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os de termos de intera^ao em uma analise de variancias). Porem, todos os testes 
estatisticos desse tipo produzem como resultado uma estatistica do teste, que e 
somente o resultado numerico do teste, e um valor de probabilidade (ou valor de 
P), que e associado a estatistica do teste. 

A hIpotese nula estatistica Antes de podermos definir a probabilidade de um 
teste estatistico, precisamos definir a hipotese nula estatistica ou H 0 . Vimos, que 
os cientistas preferem explicates cautelosas ou simples ao inves das mais com- 
plexas. Qual e a explana^ao mais simples para explicar a diferen^a nas medias 
dos dois grupos? Em nosso exemplo, a mais simples e de que as diferen^as re- 
presentam varia^ao aleatoria entre os grupos e nao refletem qualquer efeito sis- 
tematico dos carros de neve. Em outras palavras, se dividirmos os lobos em dois 
grupos, mas nao expormos os individuos de nenhum deles aos carros de neve, 
ainda assim podemos encontrar medias que diferem uma da outra. Lembre-se 
que e extremamente improvavel que as medias de duas amostras de numeros 
sejam iguais, mesmo se elas forem amostradas a partir de uma popula^ao maior, 
usando um processo identico. 

Os niveis de glicocorticoides irao diferir de um individuo para outro por 
muitas razoes que nao podem ser estudadas ou controladas neste experimen- 
to, e toda esta varia^ao - incluindo aquela devido a erros de medida - e o que 
rotulamos de varia<;ao aleatoria. Queremos saber se ha qualquer evidencia de 
que a diferen^a na media observada nos niveis de GC dos dois grupos e maior 
que esperariamos dada a varia^ao aleatoria entre os individuos. Assim, uma 
hipotese nula estatistica tipica seria que “diferen^as entre os grupos nao sao 
maiores que a que esperariamos devido a varia^ao aleatoria.” Chamamos isso 
de hipotese nula estatistica, porque a hipotese e de que algum mecanismo ou 
for^a especificos - alguma for^a que nao a varia<;ao aleatoria - nao esta ope- 
rando. 

A hipOtese alternativa Uma vez que declaramos a hipotese nula estatistica, de- 
finimos entao uma ou mais alternativas a hipotese nula. Em nosso exemplo, a hi¬ 
potese alternativa natural e de que a diferen^a observada na media dos niveis de 
GC dos dois grupos e muito grande para ser explicada apenas pela varia<;ao alea¬ 
toria entre individuos. Note que a hipotese alternativa nao e de que a exposi^ao 
aos carros de neve e responsavel pelo aumento de GC! Em vez disso, a hipotese 
alternativa e focada simplesmente no padrao presente nos dados. O pesquisador 
pode inferir mecanismos a partir dos padroes, mas essa inferencia e um passo a 
parte. O teste estatistico meramente revela se o padrao e provavel ou nao, dado 
que a hipotese nula seja verdadeira. Nossa habilidade em apontar mecanismos 
causais a esses padroes estatisticos depende da qualidade do nosso delineamento 
experimental e das nossas medidas. 



Pri nci'pios de Estati'stica em Ecologia 111 


Por exemplo, suponha que o grupo de lobos expostos aos carros de neve 
tambem tenham sido ca^ados e perseguidos por humanos e seus cachorros de 
ca^a durante o dia anterior, enquanto o grupo nao exposto inclui lobos de uma 
drea remota nao habitada por humanos. As analises estatisticas provavelmente 
revelariam diferen<;as significativas nos niveis de GC entre os dois grupos in- 
dependentemente da exposi^ao aos carros de neve. Contudo, seria arriscado 
concluir que as diferen<;as entre as medias dos dois grupos foi causada pelos 
carros de neve, mesmo pensando que podemos rejeitar a hipotese nula esta- 
tistica de que o padrao e explicado pela varia^ao aleatoria entre individuos. 
Neste caso, o efeito do tratamento £ confundido com outras diferen<,as entre 
os grupos-controle e tratamento (exposi^ao aos cachorros de ca^a), que sao 
potencialmente relacionadas aos niveis de estresse. Conforme discutiremos nos 
Capitulos 6 e 7, um objetivo importante para um bom delineamento amostral 
£ evitar confusoes. 

Se nosso experimento fosse delineado e executado corretamente, seria segu- 
ro inferir que a diferen^a entre as medias £ causada pela presen^a de carros de 
neve. Porem, mesmo assim, nao podemos apontar precisamente o mecanismo 
fisiologico se tudo que fizemos foi medir os niveis de GC de individuos expostos 
e nao expostos. Precisariamos de informa<;6es muito mais detalhadas sobre a 
fisiologia hormonal, quimica, sanguinea e similares, se quisermos chegar aos 
mecanismos subjacentes.'' A estatistica nos ajuda a estabelecer padroes convin- 
centes e a partir deles podemos fazer inferences ou tomar conclusoes acerca de 
relates de causa e efeito. 

Na maioria dos testes, a hipotese alternativa nao e explicitamente declarada 
porque em geral ha mais de uma que pode explicar os padroes dos dados. Em 
vez disso, consideramos o conjunto de alternativas como sendo “nao Hy”. Em um 
diagrama de Venn, todos os resultados de dados podem entao ser classificados ou 
em H 0 ou nao 

O valor de p Em muitas analises estatisticas queremos saber quando a hipotese 
nula de varia^ao aleatoria entre individuos pode ser rejeitada. O valor de P e um 
guia para tomar essa decisao. Um valor de P estatistico mede a probabilidade de 
que a diferen^a observada ou mais extrema poderia ser encontrada se a hipotese 
nula fosse verdadeira. Utilizando a nota^ao de probabilidades condicionais apre- 
sentada no Capitulo 1, valor de P = P(dados | H 0 ). 


Mesmo se os mecanismos fisiologicos forem elucidados, ainda haveria questoes acerca dos meca¬ 
nismos tinais no nivel molecular ou genetico. Sempre que propomos um mecanismo havera proces¬ 
ses em niveis menores que nao sao completamente descritos por nossas explicates e precisam ser 
tratados como uma “caixa preta/' Contudo, nem todos os processos em niveis maiores podem ser 
explicados com sucesso pelo reducionismo a mecanismos de niveis menores. 
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Suponha que o valor de P seja relativamente pequeno (proximo de 0,0). Entao 
e improvavel (a probabilidade e pequena) que a diferen^a observada tenha sido 
obtida se a hipotese nula fosse verdadeira. No exemplo dos lobos e carros de neve, 
um valor de P baixo pode significar que e improvavel que a diferen<;a de 600 ng/g 
no nivel de GC tenha sido observada entre os grupos expostos e nao expostos caso 
houvesse apenas varia^ao aleatoria entre os individuos e nenhum efeito consis- 
tente dos carros de neve (i. e., se a hipotese nula fosse verdadeira). Portanto, com 
um valor de P pequeno, o resultado seria improvavel dada a hipotese nula, entao 
a rejeitamos. Como tinhamos apenas uma hipotese alternativa em nosso estudo, 
nossa conclusao e de que carros de neve (ou algo associado a eles) podem ser res- 
ponsaveis pela diferen^a entre os grupos de tratamentos. * 1 2 3 4 * * * * * * * * * 14 


11 Aceitar uma hipotese alternativa com base neste mecanismo de testar a hipotese nula e um exemplo 
da falacia de “afirmar o consequente” (Baker, 1989). Formalmente, o valor de P = P(dados | H 0 ). Caso 
a hipotese nula seja verdadeira, poderia resultar em (ou nos termos da logica, implicar ) um conjunto 
particular de observa<;6es (neste caso, os dados). Podemos escrever isso formalmente como H 0 => 
dados nulos, onde a seta e lida como “implica.” Se suas observances sao diferentes das esperadas sob 
H 0 , entao um valor de P baixo sugere que H 0 seus dados, e a seta cortada e lida como “nao implica”. 
Como voce estipulou apenas uma hipotese alternativa, H a , entao voce esta estipulando tambem que 
H a = —i H 0 onde o simbolo —■ significa "nao", e as unicas possibilidades para os dados sao os possiveis 
sob H 0 (“dados nulos”) e aqueles que nao sao possiveis sob H 0 (“—■ dados nulos" = "seus dados"). 
Assim, voce esta declarando a seguinte logica de progressao: 

1. Dado: H 0 => dados nulos 

2. Observe: —i dados nulos 

3. Conclua: —i dados nulos => —iH 0 

4. Assim: —iH 0 (=H a ) => —i dados nulos 

Mas, realmente, tudo que voce pode concluir e o ponto 3: —i dados nulos => —iH 0 (o conhecido 
contrapositivo de 1). Em 3, a hipotese alternativa (H a ) e o “consequente,” e voce nao pode declarar sua 
verdade simplesmente observando seu “predicado” (—■ dados nulos em 3); muitas outras causas pos¬ 

siveis poderiam produzir esses resultados (—i dados nulos). Voce pode afirmar o consequente (decla¬ 

rar H a como verdadeira) se e somente se houver somente uma alternativa possivel a sua hipotese nula. 

No caso mais simples, onde H 0 declara “nenhum efeito” e H a , “algum efeito,” proceder de 3 para 4 faz 
sentido. Mas biologicamente, em geral e mais interessante saber qual e o verdadeiro efeito (oposto a 
simplesmente mostrar que ha “algum efeito”). 

Considere o exemplo anterior, das formigas, neste capitulo. Permita que H 0 = todas as 25 for- 
migas em Harvard Forest sao Myrmica , e H a = 10 formigas na floresta nao sao Myrmica. Caso colete 

um especime de Camponotus na floresta, voce pode concluir que os dados implicam que a hipotese 

nula e falsa (observa^ao de uma Camponotus na floresta => — iH 0 ). Mas voce nao pode tirar nenhuma 
conclusao sobre a hipotese alternativa. Voce pode apoiar uma hipotese alternativa menos rigorosa, 
H a = nem todas as formigas na floresta sao Myrmica , mas afirmar essa hipotese alternativa nao lhe 
dira nada sobre a verdadeira distribui^ao das formigas na floresta, ou a identidade das especies e dos 
generos que estao presentes. 

Eis um ponto vital. Muitos cientistas parecem acreditar que, quando reportam um valor de P, 
estao fornecendo a probabilidade de observar a hipotese nula conforme os dados [P(H 0 1 dados)]. Ou 
a probabilidade de que a hipotese alternativa seja falsa, de acordo com os dados [1 - P(H a | dados)]. 
Mas, de fato, eles estao reportando algo completamente diferente - a probabilidade de observar os da¬ 
dos de acordo com a hipotese nula: P( dados | H 0 ). Infelizmente, como vimos no Capitulo 1, P( dados | 

H 0 ) ^ P( H () | dados) ^ 1 - P(H a | dados); nas palavras de um filosofo anonimo imortal de Maine, voce 

nao pode chegar la a partir daqui. No entanto, e possivel calcular diretamente P(H 0 1 dados) ou P(H a | 
dados) usando o Teorema de Bayes (Capitulo 1) e os metodos esbo^ados no Capitulo 5. 
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Por outro lado, suponha que o valor de P calculado seja relativamente grande 
(proximo a 1,0). Entao e provavel que a diferenna observada possa ter ocorrido, 
dado que a hipotese nula e verdadeira. Neste exemplo, um valor de P grande pode 
significar que uma diferenna de 600-ng/g nos niveis de GC provavelmente po- 
deria ser observada entre os grupos expostos e nao expostos mesmo quando os 
carros de neve nao tiverem nenhum efeito e que haja apenas varia^ao aleatoria 
entre os individuos. Ou seja, com um valor de P grande, os resultados observados 
poderiam ser provaveis sob a hipotese nula, entao nao temos evidencia suficiente 
para rejeita-la. Nossa conclusao e que as diferen^as nos niveis de GC entre os dois 
grupos pode ser atribuida a variancia aleatoria entre individuos. 

Tenha em mente que quando calculamos a um valor de P estatistico estamos 
olhando os dados atraves das lentes da hipotese nula. Se os padroes em nossos 
dados sao provaveis sob a hipotese nula (valor de P alto), nao temos nenhuma 
razao para rejeita-la em favor de explicates mais complexas. Por outro lado, se os 
padroes sao improvaveis sob a hipotese nula (valor de P baixo), e mais cauteloso 
rejeita-la e concluir que algo mais, alem de varia<;ao aleatoria entre individuos, 
contribui para os resultados. 

O QUE determina o valor DE P? O valor de P calculado depende de tres coisas: 
do numero de observances nas amostras («); da diferenna entre as medias das 
amostras (Y i - Y); e do nivel de varia^ao entre individuos (s 2 ). Quanto mais ob¬ 
servances em uma amostra, menor o valor de P, pois, quanto mais dados temos, 
mais provavel estimarmos a verdadeira media da populanao e podermos detec- 
tar uma diferenna real entre elas, caso ela exista (ver Lei dos Grandes Numeros, 
Capitulo 3). O valor de P tambem sera menor quanto mais diferentes os dois 
grupos forem em relanao a variavel que estamos medindo. Desse modo, uma 
diferenna de 10 ng/g na media do nivel de GC entre os grupos-controle e trata- 
mento ira gerar um valor de P mais baixo que uma diferenna de 2 ng/g, man- 
tendo as outras coisas iguais. Por fim, o valor de P sera menor caso a variancia 
entre individuos dentro de cada tratamento for pequena. Quanto menos varia- 
nao houver de um individuo para o proximo, mais facil sera detectar diferennas 
entre os grupos. No caso extremo, se os niveis de GC de todos individuos dentro 
do grupo de lobos expostos aos carros de neve forem identicos, entao qualquer 
diferenna nas medias dos dois grupos, nao importa quao pequena seja, pode 
gerar um valor de P baixo. 

Quando um valor de p e suficientemente baixo? Em nosso exemplo, obtemos 
um valor de P = 0,01 para a probabilidade de obter a diferenna observada nos 
niveis de GC entre lobos expostos e nao expostos a carros de neve. Desse modo, 
se a hipotese nula for verdadeira e houver apenas varianao aleatoria entre os indi¬ 
viduos nos dados, a chance de encontrar uma diferenna de 600 ng/g na GC entre 
os grupos expostos e nao expostos e de somente 1 em 100. Em outras palavras, se 
a hipotese nula for verdadeira e conduzirmos esse experimento 100 vezes, usan- 
do diferentes individuos em cada, poderiamos esperar que em somente um dos 
experimentos vissemos uma diferenna tao grande ou maior que a que de fato ob- 
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servamos. Portanto, parece improvavel que a hipotese nula seja verdadeira, entao 
a rejeitamos. Se nosso experimento foi delineado de maneira adequada, podemos 
concluir, com seguran^a, que os carros de neve causam aumento nos niveis de 
GC, apesar de nao podermos especificar o que, nos carros de neve, causa esta 
resposta. Por outro lado, se o valor da probabilidade estatistica calculada fosse P = 
0,88, poderiamos esperar um resultado similar ao que encontramos em 88 de 100 
experimentos, devido a varia«;ao aleatoria entre os individuos; assim, o resultado 
observado poderia nao ser de todo incomum sob a hipotese nula e nao haveria 
razao para rejeita-la. 

Mas qual e o ponto de corte preciso que devemos empregar para rejeitar ou 
nao uma hipotese nula? Eis uma decisao subjetiva, ja que nao existe nenhum valor 
natural critico abaixo do qual devemos sempre rejeitar a hipotese nula e acima 
do qual nunca devemos rejeita-la. Entretanto, apos muitas decadas de pratica, 
tradi^io, e de um esfor^o vigilante dos editores e revisores de periodicos, o valor 
operacional critico para tomar essa decisao e de 0,05. Ou seja, se a probabilidade 
estatistica P < 0,05, a conven<;ao diz para rejeitar a hipotese nula; e se a probabili¬ 
dade estatistica P > 0,05, ela nao e rejeitada. Quando cientistas reportam que um 
resultado em particular e “significativo”, quer dizer que rejeitaram a hipotese nula 
com um valor de P < 0,05. 13 

Um pouco de reflexao deve convence-lo de que um valor critico de 0,05 e 
relativamente baixo. Se usar essa regra em seu cotidiano, voce nunca levaria um 
guarda-chuva consigo a menos que a previsao de chuva seja, no minimo, de 95%. 
Voce ficaria ensopado muito mais frequentemente que seus vizinhos e amigos. 
Por outro lado, se eles o virem carregando um guarda-chuva, podem hear bastan- 
te confiantes de que vai mesmo chover. 

Em outras palavras, assumir um valor critico = 0,05 como padrao para rejei¬ 
tar a hipotese nula e muito conservador. Isso requer que a evidencia seja muito 
forte para rejeitar a hipotese nula estatistica. Alguns pesquisadores estao descon- 
tentes com a utiliza^ao de um valor critico arbitrario e por assumir um valor tao 
baixo quanto 0,05. Afinal, a maioria de nos pegaria um guarda-chuva com uma 
previsao de 90%; entao, por que nao deveriamos ser um pouco menos rigidos em 
nosso padrao para rejeitar a hipotese nula? Talvez devessemos assumir um valor 
critico = 0,10, ou talvez usar valores criticos diferentes para variadas formas de 
dados e questoes. 


'"Quando cientistas discutem resultados“significativos”em seus trabalhos, estao na verdade falando 
sobre quao confiantes estao de que a hipotese nula tenha sido rejeitada corretamente. Mas o publico 
iguala “significativo” a “importante” Contudo, essa distin^ao nao causa um fim a confusao, e e uma 
das razoes pelas quais os cientistas gastam bastante tempo comunicando claramente suas ideias em 
revistas populares. 
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Uma defesa do ponto de corte de 0,05 £ a observa^ao de que os padroes 
cientificos precisam ser altos, de forma que os pesquisadores possam se apoiar 
com confian^a no trabalho alheio. Se a hipotese nula for rejeitada a um padrao 
mais liberal, havera maior risco de rejeitar uma hipotese nula verdadeira (erro 
Tipo I, descrito em mais detalhes a seguir). Se estivermos tentando construir 
hipdteses e teorias cientificas com base nos dados e resultados de outros, tais 
erros diminuem o progresso cientifico. Ao usar um valor critico baixo, pode- 
mos ficar confiantes de que os padroes nos dados sao, de certo modo, fortes. 
Contudo, mesmo um valor critico baixo nao £ uma prote<;ao contra estudos 
ou experimentos maldelineados. Em tais casos, a hipdtese nula pode ser rejei¬ 
tada, mas os padroes nos dados refletem falhas na amostragem ou nas mani¬ 
pulates, e nao relacionadas its diferen<,as biologicas subjacentes que estamos 
tentando entender. 

Talvez o argumento mais forte a favor da necessidade de um valor critico bai¬ 
xo 6 o de que n6s, humanos, somos psicologicamente predispostos a reconhecer e 
ver padroes em nossos dados, mesmo quando inexistentes. Nosso sistema senso¬ 
rial vertebrado e adaptado para organizar dados e observances em padroes “uteis”, 
gerando um vi£s embutido no senlido de rejeitar a hipotese nula e de ver padroes 
onde, na verdade, hd aleatoriedade (Sale, 1984). 16 Um valor critico baixo e uma 
medida de seguran<;a contra tais alividades e que tambem ajuda a agir como uma 
barreira sobre a taxa de publicates cientificas, pois e muilo menos provdvel que 
os resultados nao significativos sejam reportados ou publicados. 1 Enfatizamos, 
contudo, que nenhuma lei itnpdc um valor critico < 0,05 para que os resultados 
sejam declarados significantes. Em muitos casos, pode ser mais util reportar o 
exato valor do P e deixar que os leitores decidam por si s6 o quanto os resultados 
sao importantes. No entanto, na realidade pratica, revisores e editores habitual- 
mente nao permitirao que voce discuta os mecanismos que nao sao apoiados por 
um resultado com P < 0,05. 


' Uma ilustra<^ao fascinante disto e pedir a um amigo para desenhar um conjunto de 25 pontos loca- 
lizados de forma aleatoria em um peda^o de papel. Se voce comparar a distribui^ao desses pontos a 
um conjunto de pontos realmente aleatorios gerados por um computador, voce vera com frequencia 
que os pontos desenhados sao distintamente nao aleatorios. As pessoas tendem a espa^ar os pontos 
de forma muito equidistante pelo papel, enquanto um padrao verdadeiramente aleatorio gera "agre- 
gados” e *'buracos" aparentes. Em razao dessa tendencia a ver padroes em tudo, devemos usar um 
valor critico baixo para garantir que nao estamos enganando a nos mesmos. 

A conhecida tendencia das revistas em rejeitarem artigos com resultados nao significantes (Mur- 
taugh, 2002a) - e, consequentemente, os autores que nao se esfor^aram para tentar publica-ios nao 
e algo positivo. No metodo hipotetico-dedutfv r o, a ciencia avan^a atraves da elimina^ao de hipoteses 
alternativas, e isso com frequencia pode ser feito quando falhamos em rejeitar a hipotese nula. Entre- 
tanto, essa abordagem requer que os autores especifiquem e testem as predi^oes que sao feitas pelas 
hipoteses alternativas competidoras. Testes estatisticos com base em H 0 versus sem H (> frequentemen- 
te nao permitem essa forma de especificidade. 
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HipOtese estatIstica versus reducionismo de hipoteses cientifi'cas A maior 
dificuldade em usar um valor de P resulta da falha em distinguir a hipotese nula 
estatIstica das cientificas. Lembre-se de que uma hipotese cientifica representa um 
mecanismo formal para explicar os padroes nos dados. Neste caso, nossa hipotese 
cientifica e a de que carros de neve causam estresse em lobos, o que propusemos 
testar medindo os niveis de GC. Altos niveis de GC podem surgir de comple- 
xas mudan^as na fisiologia e levar a mudan^as na produ^ao de GC quando um 
animal esta estressado. Em contraste, a hipotese nula estatistica e uma declara^ao 
acerca dos padroes nos dados e da verossimilhan^a com que esses padroes podem 
surgir por acaso ou por processos aleatorios que nao sao relacionados de maneira 
explicita aos fatores que estamos estudando. 

Usamos os metodos de probabilidade quando decidimos se rejeitamos ou 
nao a hipotese nula estatistica; pense nesse processo como uma maneira de 
padronizar os dados. A seguir, concluimos acerca da validade de nossa hipo¬ 
tese cientifica baseando-nos nos padroes estatisticos dos dados. A for<;a des- 
ta inferencia depende muito dos detalhes dos delineamentos experimental e 
amostral. Em um experimento bem-delineado e replicado, que inclui controles 
apropriados e que os individuos sao atribuidos aleatoriamente a tratamentos 
bem-definidos, podemos ficar bastante confiantes acerca de nossas inferences 
e de nossa habilidade para avaliar a hipotese cientifica sob considera^ao. Con- 
tudo, em um estudo amostral no qual nao podemos manipular nenhuma va- 
riavel, mas simplesmente medir diferen^as entre grupos, torna-se dificil fazer 
inferencias solidas acerca da hipotese cientifica subjacente, mesmo se tivermos 
rejeitado a hipotese nula estatistica. 18 

Acreditamos que a questao mais geral nao e o valor critico em particular 
que e escolhido, mas se sempre devemos usar uma estrutura de testes de hipo- 
teses. Com certeza, para muitas questoes, os testes de hipoteses estatisticos sao 
uma poderosa forma de estabelecer quais padroes existem ou nao nos dados. 
Porem, em muitos estudos, a verdadeira questao pode nao ser o teste de hi¬ 
poteses, mas a estimativa de parametros. Por exemplo, no caso do estudo de 
estresse, pode ser mais importante determinar a amplitude dos niveis de GC 
esperada para os lobos expostos aos carros de neve, em vez de apenas estabe¬ 
lecer que os carros de neve aumentam de forma significativa os niveis de GC. 


18 Em contraste ao exemplo dos carros de neve e dos lobos, suponha que tenhamos medido os niveis 
de GC de 10 lobos velhos escolhidos de maneira aleatoria e de 10 lobos jovens escolhidos da mesma 
forma. Poderiamos ficar tao confiantes acerca de nossas inferencias, como no caso do experimento 
dos carros de neve? Por que? Quais sao as diferen^as, se houver, entre experimentos em que manipu- 
lamos individuos em diferentes grupos (lobos expostos versus nao expostos) e amostragens em que 
medimos a varia^ao entre grupos, mas nao manipulamos diretamente ou alteramos as suas condi- 
$oes (lobos velhos versus jovens)? 
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Alem disso, tambem deveriamos estabelecer o nivel de confian^a ou certeza em 
nossa estimativa de parametros. 

Erros em testes de hipoteses 

Apesar de a estatistica envolver muitos calculos precisos, e importante nao 
perder de vista o fato de que a estatistica e uma disciplina mergulhada em in- 
certezas. Tentamos usar dados limitados e incompletos para fazer inferences 
acerca de mecanismos subjacentes que podemos entender apenas em parte. 
Na realidade, a hipotese nula estatistica e verdadeira ou falsa; se tivermos in- 
forma^oes perfeitas e completas, podemos saber quando ela e verdadeira ou 
nao, e nao precisariamos de estatistica para afirmar isso. Ao contrario, temos 
apenas nossos dados e metodos de inferencia estatistica para decidir quando 
rejeitar ou nao a hipotese nula estatistica. Isso leva a uma interessante tabela 
2 x 2 de resultados possiveis sempre que testamos uma hipotese nula estatistica 
(Tabela 4.1). 

Idealmente, gostariamos de encerrar nas celulas superior esquerda ou na 
inferior direita da Tabela 4.1. Em outras palavras, quando ha apenas varia^ao 
aleatoria em nossos dados, esperariamos nao rejeitar a hipotese nula estatis¬ 
tica (celula superior esquerda) e, quando houver algo mais, rejeita-la (celula 
inferior direita). Contudo, podemos nos encontrar em uma das outras duas 
celulas, que correspondem a dois tipos de erros que podem ser cometidos em 
uma decisao estatistica. 

Erro tipo i Se rejeitarmos erroneamente uma hipotese nula que era verda¬ 
deira (celula superior direita da Tabela 4.1), teremos feito uma afirma^ao falsa 
de que algum fator acima e alem da varia<;ao aleatoria esta causando o padrao 


TABELA 4.1 

O mundo quadruplo dos testes de hipoteses 


Manter H 0 

Rejeitar H 0 

H 0 verdadeira 

Decisao correta 

Erro Tipo I (a) 

H 0 falsa 

Erro Tipo II (p) 

Decisao correta 


A hipotese nula subjacente e verdadeira ou falsa, mas no mundo real precisamos usar amostragens e 
dados limitados para tomar a decisao de aceitar ou nao a hipotese nula. Sempre que uma decisao esta¬ 
tistica e tomada, um entre quatro resultados possiveis ira ocorrer. Uma decisao correta ocorre quando 
mantemos uma hipotese nula que e verdadeira (canto superior esquerdo), ou rejeitamos uma hipotese 
nula que e falsa (canto inferior direito). As outras duas possibilidades representam erros no processo de 
decisao. Se rejeitarmos uma hipotese nula verdadeira, cometemos o erro Tipo I (canto superior direi¬ 
to). Testes parametricos padrao buscam controlar o a, a probabilidade do erro Tipo I. Se mantivermos 
uma hipotese nula falsa, cometemos o erro Tipo II (canto inferior esquerdo). Entao, a probabilidade 
de erro Tipo II e (3. 
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em nossos dados. Este e o erro Tipo I, e por conven^ao, a probabilidade de 
comete-lo e denotada por a. Quando voce calcula um valor de P estatistico, 
esta, na verdade, estimando o a. Desse modo, uma defini^ao mais precisa do 
valor de P e de que ele representa a chance de que iremos cometer um erro Tipo 
I, de erroneamente rejeitar uma hipotese nula verdadeira. 19 Essa defini^ao da 
mais apoio para aceitar a significance estatistica somente quando o valor de P 
e muito pequeno. Quanto menor o valor de P, mais confiantes podemos ficar 
de que nao cometeremos um erro Tipo I se rejeitarmos H 0 . No exemplo do 
glicocorticoide, o risco de cometer um erro Tipo I ao rejeitar a hipotese nula e 
de 1%. Como vimos anteriormente, publica<;oes cientificas tern um padrao de 
um risco maximo de 5% de erro Tipo I de rejeitar a hipotese nula. Na avalia^ao 
de impactos ambientais, o erro Tipo I pode ser um “falso-positivo” no qual, por 
exemplo, o efeito de um poluente sobre a saude humana e reportado, mas de 
fato nao existe. 

Erro tipo ii e poder estatistico A celula inferior da esquerda, na Tabela 4.1, 
representa o erro Tipo II. Neste caso, o investigador falha incorretamente em re¬ 
jeitar uma hipotese nula que e falsa. Em outras palavras, existem diferen^as siste- 
maticas entre os grupos sendo comparados, mas o investigador falha em rejeitar 
a hipotese nula e conclui - incorretamente - que ha somente a varia^ao aleatoria 
entre as observa^oes. Por conven^ao, a probabilidade de cometer um erro Tipo II 
e denotada por (3. Na avalia^ao ambiental, o erro Tipo II pode ser um “falso-ne- 
gativo” no qual, por exemplo, ha o efeito de um poluente sobre a saude humana, 
mas ele nao e detectado. 20 


12 Seguimos tratamentos estatisticos padrao que equiparam o valor de P calculado com a estimativa 
da taxa a de erro Tipo 1. Contudo, o valor evidente do P de Fisher pode nao ser estritamente equiva- 
lente ao a de Neyman e Pearson. Os estatisticos discordam se essa distin<;ao e uma importante ques- 
tao filosofica ou simplesmente uma diferen^a semantica. Hubbard e Bayarri (2003) argumentam que 
a incompatibilidade e importante, e o artigo deles e seguido por discussoes, comentarios e respostas 
de outros estatisticos. Fique por dentro! 

20 A rela^ao entre os erros Tipo I e Tipo II permeiam as discussoes do principio de precau<;ao em 
tomadas de decisoes ambientais. Ao longo da historia, por exemplo, agendas de controle assu- 
mem que novos produtos quimicos sao benignos ate que provem o contrario. Sao necessarias 
evidencias muito fortes para rejeitar a hipotese nula de que nao ha efeito na saude e no bem-estar. 
Os fabricantes de quimicos e outros poluentes em potencial estao empenhados em minimizar a 
probabilidade de cometer um erro Tipo I. Em contraste, grupos ambientalistas que representam 
o publico geral estao interessados em minimizar a probabilidade de que os fabricantes cometam 
o erro Tipo II. Tais grupos assumem que um quimico e nocivo ate que prove ser benigno, e estao 
dispostos a aceitar uma probabilidade maior em cometer um erro Tipo I, se isso significa que 
podem ficar mais confiantes de o fabricante nao aceitar erroneamente a hipotese nula. Seguindo 
tal raciodnio, ao avaliar o controle de qualidade da produ^ao industrial, os erros Tipo I e Tipo II 
sao com frequencia conhecidos por erros do produtor e do consumidor, respectivamente (Sokal 
e Rolf, 1995). 




Prindpios de Estati'stica em Ecologia 119 


Um conceito relacionado a probabilidade de cometer o erro Tipo II e o poder 
do teste estatlstico. O poder e calculado como 1 - (3 e equipara a probabilidade de 
corretamente rejeitar a hipotese nula, quando falsa. Queremos que nossos testes 
estatisticos tenham poder para que haja um aumento nas chances de detectar pa- 
droes significativos em nossos dados, quando presentes. 

Qual £ a relaqAo entre erro tipo i e tipo ii? Como ideal, gostariamos de mi- 
nimizar tanto o erro Tipo I quanto o Tipo II em nossas inferences estatisticas. 
Contudo, estrategias designadas para reduzir o erro Tipo I inevitavelmente au- 
mentam o risco de erro Tipo II, e vice-versa. Por exemplo, suponha que decida 
rejeitar a hipotese nula somente se P < 0,01 - um padrao 5 vezes mais rigoroso 
que o criterio convencional de P < 0,05. Embora seu risco de cometer o erro 
Tipo I seja agora muito menor, existe uma chance muito maior de que, quan¬ 
do falhar em rejeitar a hipotese nula, podera faze-lo incorretamente (i. e., voce 
estara cometendo o erro Tipo II). Apesar dos erros Tipo I e Tipo II serem in- 
versamente relacionados um ao outro, nao existe nenhuma rela^ao matematica 
entre eles, pois a probabilidade do erro Tipo II depende, em parte, de qual e a 
hipotese alternativa, de quao grande e o efeito que queremos detectar (Figura 
4.5), do tamanho amostral e da sagacidade do nosso delineamento experimental 
ou protocolo amostral. 

Por que as decisOes estatisticas se baseiam no erro tipo i? Em contraste a 
probabilidade de cometer o erro Tipo I, que determinamos com testes esta¬ 
tisticos padrao, a probabilidade de cometer o erro Tipo II nao e reportada ou 
calculada com frequencia, e em muitos artigos cientificos a probabilidade de 
cometer o erro Tipo II, nem e discutida. Por que nao? Para come^ar, muitas 
vezes nao podemos calcular a probabilidade de erro Tipo II, a menos que a 
hipotese alternativa seja especificada de maneira completa. Em outras palavras, 
se queremos determinar o risco de erroneamente aceitar a hipotese nula, as 
alternativas devem ser desenvolvidas alem de “nao H 0 ”. Em contraste, calcular a 
probabilidade de um erro Tipo I nao requer essa especifica^ao; em vez disso, e 
necessario apenas cumprir alguns pressupostos de normalidade e independen¬ 
ce (ver Capitulos 9 e 10). 

Em uma base filosofica, alguns autores argumentaram que o erro Tipo I e um 
equivoco mais serio na ciencia do que o do Tipo II (Shrader-Frechette e McCoy, 
1992). O erro Tipo I e de falsidade, no qual incorretamente rejeitamos a hipotese 
nula e alegamos um mecanismo mais complexo. Outros podem seguir nosso tra- 
balho e tentar construir seus proprios estudos com base naquela alega^ao falsa. 
Em contraste, o de Tipo II e um erro de ignorancia. Apesar de nao termos rejeita- 
do a hipotese nula, alguem com um experimento melhor ou com mais dados po¬ 
dera ter condi^ao de rejeita-la no futuro, e a ciencia ira progredir daquele ponto. 
No entanto, e em muitos problemas aplicados, como o monitoramento ambiental 
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Figura 4.5 Rela^ao entre poder estatistico, valor de P e tamanho do efeito observavel em fun^ao 
do tamanho amostral. (A) 0 valor de P e a probabilidade de incorretamente rejeitar uma hipotese 
nula verdadeira, enquanto o poder estatistico e a probabilidade de corretamente rejeitar uma hi¬ 
potese nula falsa. 0 resultado geral propoe que, quanto menor o valor de P usado para rejeitar a 
hipotese nula, menor o poder estatistico de corretamente detectar urn efeito do tratamento. A urn 
dado valor de P, o poder estatistico e maior quando o tamanho amostral e maior. (B) Quanto menor 
o tamanho do efeito observavel do tratamento (i. e., quanto menor a diferenga entre o grupo-tra- 
tamento e o grupo-controle), maior e o tamanho amostral necessario a urn bom poder estatistico 
para detectar o efeito do tratamento. 21 


21 Podemos aplicar esses graficos ao nosso exemplo da compara^ao dos niveis do hormonio glico- 
corticoide das populates de lobos expostos a carros de neve (grupo-tratamento) versus lobos que 
nao foram expostos aos carros de neve (grupo-controle). Nos dados originais (Creel et al., 2002), o 
desvio-padrao da popula^ao de lobos controle nao exposta a carros de neve foi 73,1 e o dos expostos 
aos carros de neve foi de 114,2.0 painel (A) sugere que se houvesse uma diferen^a de 50 ng/g entre as 
populates experimentais e que se o tamanho amostral fosse n - 50 em cada grupo, os pesquisadores 
poderiam corretamente aceitar a hipotese alternativa somente em 51% das vezes para um P = 0,01.0 
painel (B) mostra que ocorre um aumento subito no poder conforme as populates se tornam mais 
diferentes. No estudo real e bem concebido (Creel et al., 2002), o tamanho amostral foi de 193 no 
grupo nao exposto e de 178 no exposto; as diferen^as entre as medias das populates foi de 598 ng/g; 
e o poder estatistico real do teste foi proximo de 1,0 para um P = 0,01. 
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e o diagnostico de doen^as, os erros Tipo II podem ter consequencias mais gra¬ 
ves, pois doen^as ou efeitos ambientais adversos poderiam nao ser corretamente 
detectados. 

ESTIMATIVA DE PARAMETROS E PREDKJAO 

Todos os metodos para teste de hipoteses que descrevemos - o metodo indutivo (e 
seu descendente moderno, a inferencia bayesiana), o metodo hipotetico-dedutivo 
e os testes estatlsticos de hipoteses - estao centrados na escolha de uma unica 
“resposta” explanatoria a partir de um conjunto inicial de multiplas hipoteses. 
Na ecologia e nas ciencias ambientais, e mais provavel que diversos mecanismos 
podem operar simultaneamente para produzir os padroes observados; um arca- 
bou<;o de testes de hipoteses que enfatiza explicates unicas pode nao ser apro- 
priado. Em vez de testar hipoteses multiplas, pode ser mais proveitoso estimar a 
contribui^ao relativa de cada uma para um padrao em particular. Esta abordagem 
e esbo^ada na Figura 4.6, na qual fazemos a parti^ao dos efeitos de cada hipotese 
sobre os padroes observados, estimando o quanto cada causa contribui para o 
efeito observado. 


Testes de hipoteses 



Estimativa de parametros 



Figura 4.6 Teste de hipoteses versus estimativa de parametros. A estimativa de parametros aco- 
moda com mais facilidade mecanismos multiplos e pode permitir uma estimativa da importance 
relativa dos diferentes fatores. A estimativa de parametros pode envolver a constru^ao de inter¬ 
vals de credibilidade (verCapitulo 3) para estimar a for$a de um efeito. Uma tecnica relacionada, 
na analise de variancia, e decompor a varia^ao total dos dados em proposes que sao explicadas 
por diferentes fatores no modelo (verCapitulo 10). Ambos os metodos quantificam a importance 
relativa de diferentes fatores, enquanto o teste de hipoteses enfatiza uma decisao binaria de sim/ 
nao sobre se um fatortem um efeito mensuravel ou nao. 
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Em tais casos, ao inves de questionar quando uma causa em particular tem 
algum efeito versus nenhum efeito (i. e., ele e significativamente diferente de 0,0?), 
questionamos qual e a melhor estimativa do parametro que expressa a magnitu¬ 
de do efeito. 22 Por exemplo, na Figura 4.3, as taxas fotossinteticas medidas para as 
folhas jovens de Rhizophora mangle se ajustam a equa^ao de Michaelis-Menten. 
Essa equa^ao e um modelo simples que descreve uma variavel subindo aos poucos 
para uma assintota. A equa^ao de Michaelis-Menten aparece com frequencia na 
biologia, sendo utilizada para descrever desde cinetica enzimatica (Real, 1977) ate 
taxas de forrageamento de invertebrados (Holding, 1959). 

A equa^ao de Michaelis-Menten tem a seguinte forma 



X + D 


onde k e D sao os dois parametros ajustados do modelo, e X e Y sao as variaveis 
independente e dependente. Neste exemplo, k representa a assintota da curva - 
que, neste caso, e a taxa maxima de assimila«;ao; a variavel independente X e a 
intensidade luminosa; e a variavel dependente Ye a taxa liquida de assimila^ao. 
Para os dados da Figura 4.3, a estimativa do parametro k e uma taxa maxima de 
assimila^ao de 7,1 pmol C0 2 m~ 2 s” 1 . Isto esta de acordo com uma “estimativa 
visual” de onde a assintota poderia estar no grafico. 

O segundo parametro da equa<;ao de Michaelis-Menten e o D, a constan- 
te de meia satura^ao. Esse parametro fornece o valor da variavel X em que o 
rendimento da variavel Ye a metade da assintota. Quanto menor o D, mais 
rapido a curva chega a assintota. Para os dados da Figura 4.3, a estimativa para 

o parametro De a radia^ao fotossinteticamente ativa (RFA) de 250 prnol CO, 

-2 -1 

m s . 

Tambem podemos medir a incerteza na estimativa dos parametros atraves 
da estimativa do erro-padrao, para construir intervalos de credibilidade (ver Ca- 
pitulo 3). O erro-padrao estimado para k = 0,49 e para o D = 71,3. Os testes de 
hipoteses e a estimativa de parametros sao relacionados, pois, se o intervalo de 
confian^a da incerteza inclui o 0,0, em geral nao teremos condi^oes para rejeitar 
a hipotese nula de nenhum efeito para um dos mecanismos. Para os parametros 
k e D da Figura 4.3, o valor de P para o teste da hipotese nula de que o parame¬ 
tro nao e diferente de 0,0 e de 0,0001 e 0,004, respectivamente. Desse modo, 
podemos ficar bastante confiantes em nossa declara^ao de que esses parametros 
sao maiores que 0,0. Mas, para a proposta de avalia^ao e ajuste de modelos, os 
valores numericos dos parametros sao mais informativos do que somente ques¬ 
tionar se eles diferem ou nao de 0,0. Nos proximos capitulos daremos outros 
exemplos de estudos nos quais os parametros do modelo sao estimados a partir 
dos dados. 


2 ” O Capitulo 9 apresenta algumas das estrategias utilizadas para ajustar curvas e estimar parametros 
de dados. Ver Hilborn e Mangel (1997) para uma discussao detalhada. Clark et al. (2003) descrevem 
estrategias bayesianas recentes para ajuste de curvas. 
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RESUMO 


A ciencia e feita a partir dos metodos indutivos e hipotetico-dedutivos. Em 
ambos, os dados observados sao comparados aos preditos pelas hipoteses. Pelo 
metodo indutivo, que inclui as modernas analises bayesianas, uma unica hipo- 
tese e testada e modificada repetidas vezes; o objetivo e confirmar ou declarar a 
probabilidade de uma hipotese em particular. Em contraste, o metodo hipoteti- 
co-dedutivo requer o estabelecimento simultaneo de multiplas hipoteses. Am¬ 
bos sao testados contra observances, com objetivo de falsear ou eliminar quase 
todas hipoteses alternativas, restando uma. Estatisticas sao usadas para testar as 
hipoteses com objetividade, e podem ser usadas tanto nas abordagens indutivas 
quanto nas hipotetico-dedutivas. 

As probabilidades sao calculadas e reportadas com virtualmente todos os tes¬ 
tes estatisticos. Os valores de probabilidade associados a esses testes podem nos 
permitir inferir causas para o fenomeno em estudo. Testes de hipoteses estatis¬ 
ticas usando o metodo hipotetico-dedutivo fornecem estimativas relacionadas a 
chance de obter um resultado igual ou mais extremo que o observado, dado que 
a hipotese nula seja verdadeira. O valor de P tambem e a probabilidade de rejeitar 
incorretamente a hipotese nula (ou de cometer o erro estatistico do Tipo I). Por 
convennao e tradinao, 0,05 e o ponto de corte nas ciencias para dizer que um re¬ 
sultado e estatisticamente significante. O calculo do valor de P depende do nume- 
ro de observances, da diferenna entre as medias dos grupos que estao sendo com¬ 
parados e da quantidade de varianao entre individuos dentro de cada grupo. O 
erro estatistico do Tipo II ocorre quando uma hipotese nula falsa e erroneamente 
aceita. Este tipo de erro pode ser tao serio quanto o do Tipo I, mas a probabilidade 
de erro Tipo II raras vezes e reportada em publicanoes cientificas. Os testes de 
hipoteses estatisticas usando metodos indutivos ou bayesianos produzem estima¬ 
tivas da probabilidade de uma hipotese ou hipoteses de interesse, conforme os 
dados observados. Como sao metodos confirmatorios, nao fornecem estimativas 
dos erros Tipo I e Tipo II. Em vez disso, os resultados sao expressos como possi- 
bilidades (odds) ou como a verossimilhanna de que uma hipotese em particular 
seja correta. 

Independente do metodo usado, toda ciencia progride articulando hipoteses 
testaveis, coletando dados que podem ser usados para testar as predinoes das hi¬ 
poteses e relacionando os resultados as relanoes de causa e efeito subjacentes. 



< 


> 


5 

Tres Estruturas Para 
Analises Estatfsticas 


N este capitulo apresentaremos as tres maiores estruturas para analises estatis- 
ticas: analises de Monte Carlo, analises parametricas e analises bayesianas. 
Resumidamente, a primeira faz pressupostos minimos acerca da distribui^ao sub- 
jacente dos dados. Ela usa randomiza^des dos dados observados como base para 
as inferencias. As analises parametricas assumem que os dados foram amostrados 
de uma distribute subjacente com forma conhecida, como aquelas descritas no 
Capitulo 2, e estimam os parametros da distribui^ao a partir dos dados. Estimam, 
ainda, probabilidades da frequencia observada dos eventos e usam essas probabili- 
dades como base para as inferencias. Como consequencia, £ um tipo de inferencia 
frequentista. As analises bayesianas tambem assumem que os dados foram amos¬ 
trados de uma distribui<;ao subjacente de forma conhecida. E estimam parametros 
nao apenas dos dados, mas tambem a partir do conhecimento previo, e atribuem 
probabilidades a esses parametros. Essas probabilidades formam as bases da infe¬ 
rencia bayesiana. A maioria dos textos convencionais ensina estatistica parametrica 
aos estudantes, mas as oulras duas sao tambem importantes, e as analises de Monte 
Carlo, na verdade, sao mais faceis de aprender inicialmente. Para apresentar esses 
metodos iremos usar cada um deles para analisar o mesmo problema amostral. 

PROBLEMAAMOSTRAL 

Imagine que voce estd tentando comparar a densidade de formigueiros do tipo 
forrageadoras em dois habitats - campo e floresta. Neste problema amostral, nao 
nos preocuparemos com a hipotese cientifica em teste (talvez ainda nem tenha- 
mos uma neste ponto); simplesmente seguiremos pelo processo de obter e anali¬ 
sar os dados para determinar se existem diferen<jas consistentes na densidade de 
formigueiros nos dois habitats. 
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Voce visita uma floresta e um campo adjacente e estima a densidade media de 
formigueiros em cada um, usando amostragem replicada. Em cada habitat voce 
escolhe uma localiza^ao ao acaso, coloca uma parcela quadrada com area de 1 
m : e, com cuidado, conta todos os formigueiros que ha dentro da parcela. Voce 
repete esse procedimento muitas vezes em cada habitat. A questao da escolha de 
locais aleatorios e muito importante para qualquer tipo de analise estatistica. Sem 
metodos mais complicados, como na amostragem estratificada, a randomiza<;ao e 
a unica medida de segurar^a para garantir uma amostra representativa da popu- 
la<;ao (ver Capitulo 6). 

A escala espacial da amostragem determina o escopo da inferencia. Estrita- 
mente falando, esse delineamento amostral permitira que voce discuta difereiKjas 
entre a densidade de formigas em floresta e em campo neste sitio em particular. 
Um melhor delineamento seria visitar varias florestas e campos diferentes e amos- 
trar uma parcela dentro de cada um. Assim, as conclusoes poderiam ser mais fa- 
cilmente generalizadas. 

A Tabela 5.1 apresenta os dados em uma planilha. Eles estao dispostos com 
os nomes das linhas e colunas. Cada coluna da tabela indica uma variavel diferen- 
te que foi medida ou registrada para cada observa^ao. Neste caso, sua inten^ao 
original foi a de amostrar parcelas em 6 campos e 6 florestas, mas as parcelas em 
campos consumiam mais tempo que o esperado e voce conseguiu coletar apenas 
4 amostras em campos. Dessa forma, a tabela de dados tern 10 linhas (alem da 
primeira, que apresenta os nomes), pois voce coletou 10 amostras diferentes (6 
de florestas e 4 de campos). Ha 3 colunas. A primeira contem um numero ID 
exclusivo atribuido a cada replica. As outras colunas contem as duas informa 9 oes 


TABELA 5.1 Planilha de amostras usada para ilustrar as analises de Monte 
Carlo, parametricas e bayesianas 


Numero ID 

Habitat 

Numero de formigueiros por parcela 

i 

Floresta 

9 

2 

Floresta 

6 

3 

Floresta 

4 

4 

Floresta 

6 

5 

Floresta 

7 

6 

Floresta 

10 

7 

Campo 

12 

8 

Campo 

9 

9 

Campo 

12 

10 

Campo 

10 


Cada linha e uma observa^ao independente. A primeira coluna identifica a replica com um numero ID 
unico; a segunda indica o habitat amostrado; e a terceira, o numero de formigueiros registrados em cada 
replica. 
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registradas de cada replica: o habitat no qual foi amostrada (campo ou floresta); e 
o numero de formigueiros registrados em cada parcela. 1 

Seguindo os procedimentos do Capitulo 3, calcule a media e o desvio-padrao 
para cada amostra (Tabela 5.2). Represente graficamente os dados usando um 
grafico de barras convencional das medias e dos desvios-padrao (Figura 5.1), ou o 
mais informativo box plot descrito no Capitulo 3 (Figura 5.2). 

Apesar de os numeros coletados nos campos e em florestas mostrarem alguma 
sobreposi<;ao, eles parecem formar dois grupos distintos: as amostras de floresta 
com media de 7,0 formigueiros por parcela, e as amostras em campos com media 
de 10,75 formigueiros por parcela. Por outro lado, nosso tamanho amostral e muito 
pequeno (n = 6 amostras em florestas e n = 4 em campos). Talvez essas diferen«;as 
tenham surgido apenas por acaso ou por amostragem aleatoria. Precisamos fazer 
um teste estatistico antes de decidir se essas diferen^as sao significativas ou nao. 


TABELA 5.2 

Estatistica descritiva 

para os dados amostrais da Tabela 5.1 

Habitat 

N 

Media 

Desvio-padrao 

Floresta 

6 

7,00 

2,19 

Campo 

4 

10,75 

1,50 



Figura 5.1 Grafico de barras padrao para os dados amostrais da Tabela 5.1. A altura da barra e a me¬ 
dia da amostra e a linha vertical indica um desvio-padrao acima da media. As analises de Monte Carlo, 
parametrica e bayesiana podem ser usadas para avaliar a diferenqa nas medias entre os grupos. 

1 Muitos textos de estatistica poderiam mostrar esses dados como duas colunas de numeros, uma 
para floresta e outra para campo. Contudo, a forma que mostramos e, em geral, a reconhecida pelos 
softwares estati'sticos para analises de dados. 
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Figura 5.2 Box plot dos dados daTabela 5.1. A linha central dentro da caixa e a mediana dos dados. 
A caixa indui 50% dos dados. 0 topo indica o 75° percentil (quartil superior) dos dados, e o fundo, o 
25° percentil (quartil inferior) dos dados. As linhas verticais se estendem ate o decil superior e interior 
(90° e 10° percentil). Para as amostras de campo, existem tao poucos dados que o 75° e o 90° percentis 
nao diferem. Quando os dados possuem distribui^ao assimetrica ou discrepancias (outliers), os box 
plots podem ser mais informativos que o grafico de barras padrao, como o da Figura 5.1. 


ANALISESDE MONTE CARLO 

As analises de Monte Carlo envolvem um numero de metodos no qual os dados 
sao aleatorizados* ou misturados de forma que as observanoes sejam rearranja- 
das a diferentes tratamentos ou grupos. Essa randomiza^ao 2 especifica a hipotese 
nula sob considera^ao: de que o padrao nos dados nao e diferente daquele que 
esperariamos se as observances tivessem sido atribuidas de forma aleatoria aos 
diferentes grupos. Existem quatro passos na analise de Monte Carlo: 


2 Alguns estatisticos distinguem os metodos de Monte Carlo, em que as amostras sao tiradas de uma 
distribui^ao estatistica conhecida ou especificada, dos testes de randomiza^ao, nos quais os dados 
existentes sao embaralhados, porem nenhum pressuposto e feito acerca da distribui^ao subjacente. 
Neste livro, usamos os metodos de Monte Carlo para indicar testes de randomiza^ao. Outro conjunto 
de metodos inclui o bootstrap, em que as estatisticas sao estimadas pela sub-amostrando repetida- 
mente, com reposi^ao, um conjunto de dados. Ainda, outro conjunto de metodos inclui o jackknife, 
em que a variabilidade em um conjunto de dados e estimada excluindo sistematicamente cada ob- 
serva^ao e recalculando a estatistica (ver Figura 9.8, e a sessao “Analises Discriminantes” no Capitulo 
12). Monte Carlo, e claro, e a famosa cidade turistica de apostas da Riviera, cujos cidadaos nao pagam 
impostos e sao proibidos de entrar nas salas de jogos. 

* N. deT. Randomiza^ao vem da palavra inglesa Random , de origem francesa, usada na expressao at 
random , cujo sentido e “ao acaso”, “a esmo”, “sem sele^ao ou criterio de escolha”. O equivalente verna- 
culo do verbo randomizar poderia ser casualizar , acidentalizar ou aleatorizar. 
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1. Especificar uma estatistica-teste ou indice para descrever o padrao dos dados. 

2. Criar uma distribui^ao da estatistica-teste que seria esperada sob a hipote- 
se nula. 

3. Decidir sobre um teste unicaudal ou bicaudal. 

4. Comparar a estatistica-teste observada a uma distribui^ao de valores simula- 
dos e estimar um valor de P apropriado como probabilidade de cauda (con- 
forme descrito no Capitulo 3). 

Passo 1: especificando o teste estatfstico 

Para essa analise empregaremos como medida do padrao a difere^a absoluta entre 
as medias das amostras de florestas e de campos (nomes dos rotulos), ou DIFF: 

DIF obs = 110,75 - 7,00| = 3,75 

O subscrito “obs” indica que o valor de DIF e calculado para os dados obser- 
vados. A hipotese nula e que a DIF obs igual a 3,75 esta dentro do que seria esperado 
pela amostragem aleatoria. A hipotese alternativa poderia ser que a DIF obs igual a 
3,75 e maior do que seria esperado ao acaso. 

Passo 2: criando a distribui^ao nula 

A seguir, estime qual seria a DIF se a hipotese alternativa fosse verdadeira. Para isso, 
use o computador (ou as cartas de um baralho) para de maneira aleatoria rearranjar 
os rotulos floresta e campo aos dados. Com a planilha aleatorizada ainda existem 4 
amostras de campo e 6 de floresta, mas seus rotulos (Campo ou Floresta) serao ale- 
atoriamente rearranjados (Tabela 5.3). Note que, na planilha de dados misturados, 
muitas observances sao colocadas no mesmo grupo, como nos dados originais. Isso 
acontecera com mais frequencia em conjuntos de dados pequenos. Depois, calcule 


TABELA 5.3 

Randomiza<;ao de Monte Carlo dos 
rotulos dos habitats da Tabela 5.1 

Habitat 

Numero de formigueiros por parcela 

Campo 

9 

Campo 

6 

Floresta 

4 

Floresta 

6 

Campo 

7 

Floresta 

10 

Floresta 

12 

Campo 

9 

Floresta 

12 

Floresta 

10 


Na analise de Monte Carlo, os rotulos das amostras da Tabela 5.1 sao rearranjados aleatoriamente entre as 
diferentes amostras. Apos, a diferen^a entre as medias dos dois grupos, DIF, e registrada. Esse procedimento 
e repetido muitas vezes, gerando uma distribui^ao de valores de DIF (Figura 5.3). 
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a estatistica das amostras para o conjunto de dados aleatorizado (Tabela 5.4). Para 
esse conjunto de dados, DIF sim = |7,75 - 9,00| = 1,25.0 subscrito “sim” indica que o 
valor de DIF foi calculado para os dados aleatorizados ou simulados. 

No primeiro conjunto de dados simulado, a diferen^a entre a media dos dois 
grupos (DIF sim = 1,25) e menor que a observada com os dados reais (DIF obs = 3,75). 
Tal resultado sugere que as medias das amostras de floresta e de campo podem di- 
ferir mais que o esperado sob a hipotese nula de atribui<;ao aleatoria. 

Contudo, existem diversas e numerosas combina<;oes aleatorias que podem 
ser produzidas rearranjando os rotulos das amostras. 1 Alguns tern valores de 
DIF . relativamente maiores e outros tern valores de DIF• menores. Repita esse 

sim sim r 

exerdcio de rearranjar muitas vezes (em geral, 1.000 ou mais), e entao ilustre a 
distribui^ao dos valores de DIF com um histograma (Figura 5.3) e as estatisticas 
descritivas (Tabela 5.5). 

A DIF media do conjunto de dados simulados foi de somente 1,46, compara- 
da ao valor observado de 3,75 para os dados originais. O desvio-padrao de 2,07 
poderia ser utilizado para construir um intervalo de confian^a (ver Capitulo 3), 
mas nao deve ser usado, pois a distribui^ao dos valores simulados (Figura 5.3) 
tern uma longa cauda a direita e nao segue uma distribui^ao normal. Um inter¬ 
valo aproximado de 95% pode ser derivado a partir dessa analise de Monte Carlo, 
identificando os percentis de 2,5, superior e inferior, dos dados do conjunto de 
valores de DIF simulados, e usar esses valores como limite superior e inferior do 
intervalo de confian<;a (Efron, 1982). 

Passo 3: decidindo sobre um teste uni ou bicaudal 

A seguir, decida se vai usar um teste unicaudal ou um teste bicaudal. A “cauda” se 
refere as areas localizadas a extrema esquerda ou direita sob a fun^ao de densidade 
de probabilidade (ver Figura 3.7). Sao essas caudas da distribui^ao as utilizadas para 


TABELA 5.4 Estatistica descritiva para os dados aleatorizados da Tabela 5.3 


Habitat 

N 

Media 

Desvio-padrao 

Floresta 

6 

9,00 

3,286 

Campo 

4 

7,75 

1,500 


Na analise de Monte Carlo, esses valores representam a media e o desvio-padrao em cada grupo apos 
um simples rearranjo dos rotulos. A diferen^a entre as duas medias (DIF = |7,75 - 9,00| = 1,25) e a 
estatistica-teste. 


3 Com 10 amostras divididas em um grupo de 6 e um grupo de 4, existem 

= 210 




v ^ j 


combina^oes que podem ser criadas embaralhando os rotulos (ver Capitulo 2). No entanto, o numero 
de valores unicos de DIF possiveis e um pouco menor, pois algumas das amostras tem contagens de 
formigueiros identicas. 
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Figura 5.3 Analise de Monte Carlo dos dados da Tabela 5.1. Para cada randomiza^ao, os rotulos 
(Floresta/Campo) foram aleatoriamente rearranjados entre as replicas. Depois, a diferenqa (DIF) en- 
tre as medias dos dois grupos foi calculada. Este histograma ilustra a distribui^ao de valores de DIF 
de 1.000 randomiza0es. A seta indica o unico valor da DIF observada no conjunto de dados real 
(3,75). Essa DIF se assenta bem na cauda direita da distribuigao. A DIF observada de 3,75 foi sempre 
maior que ou igual a todos, com excegao de 36 valores de DIF simulados. Portanto, sob a hipotese 
nula de arranjo aleatorio das amostras aos grupos, a probabilidade de encontrar essa observa^ao 
(ou uma mais extrema) e de 36/1.000 = 0,036. 


determinar o ponto de corte de um teste estatistico a um P = 0,05 (ou qualquer ou- 
tro nivel de probabilidade). Um teste unicaudal usa apenas uma cauda da distribui- 
<;ao para estimar o valor de P. Um teste bicaudal usa as duas caudas da distribui<;ao 
para estimar o valor de P. No primeiro caso, os 5% da area sob a curva estao locali- 
zados em uma das caudas da distribui^ao. No segundo, cada cauda da distribui^ao 
deve englobar 2,5% da area. Assim, um teste bicaudal requer valores mais extremos 
para atingir a significance estatistica do que um teste unicaudal. 

Contudo, o valor de corte nao e o topico mais importante ao decidir quando 
usar um teste com uma ou com duas caudas. Mais importante e a natureza da 


TABELA 5.5 Estatisticas descritivas para os 1.000 valores simulados de 
DIF da Figura 5.3 


Variavel 

N 

Media 

Desvio-Padrao 

DIF sim 

1.000 

1,46 

2,07 


Na analise de Monte Carlo, cada um desses valores foi criado rearranjando os rotulos dos dados da Tabela 
5.1 e calculando a diferen^a entre as medias dos dois grupos (DIF). O calculo do valor de P nao requer que 
a DIF siga uma distribui<;ao normal, pois o valor de Pe determinado diretamente pela localiza^ao da DIF 
observada no histograma (ver Tabela 5.6). 
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variavel resposta e a hipotese que esta sendo testada. Neste caso, a variavel respos- 
ta era a DIF, a diferen^a absoluta nas medias das amostras de floresta e campos. 
Para a variavel DIF, um teste unicaudal e mais apropriado para valores de DIF 
excepcionalmente grandes. Por que nao usar um teste bicaudal para DIF? A cauda 
inferior da distribui^ao de DIF sim poderia representar os valores de DIF que sao 
excepcionalmente pequenos quando comparados a hipotese nula. Em outras pa- 
lavras, um teste com duas caudas poderia testar tambem a possibilidade das me¬ 
dias de florestas e campos serem mais similares que o esperado ao acaso. Esse teste 
para a similaridade extrema nao e biologicamente informativo, entao a aten^ao e 
restrita a cauda superior da distribui^ao, a qual representa os casos em que a DIF 
e excepcionalmente grande quando comparada a distribui^ao nula. 

Como a analise poderia ser modificada para usar um teste bicaudal? Em vez 
de usar o valor absoluto de DIF, use a diferen^a media entre amostras de floresta 
e campo (DIF*). Diferente da DIF, a DIF* pode assumir valores tanto positivos 
quanto negativos. A DIF* sera positiva se a media do campo for maior que a da 
floresta. A DIF* sera negativa se a media de campo for menor que a da floresta. 
Como antes, randomize os dados e crie a distribui^o de DIF* sim . Neste caso, con- 
tudo, um teste bicaudal poderia detectar casos em que a media de campo seria 
excepcionalmente grande se comparada a da floresta (DIF* positiva) e casos em 
que a media de campo seria excepcionalmente pequena comparada a da floresta 
(DIF* negativa). 

Quando estiver usando a analise de Monte Carlo, parametrica ou bayesiana, 
voce deveria estudar com cuidado a variavel resposta que esta usando. Como po¬ 
deria interpretar um valor extremamente grande ou pequeno da variavel resposta 
relativo a hipotese nula? A resposta a essa questao ira ajuda-lo a decidir quando 
um teste com uma ou com duas caudas e mais apropriado. 

Passo 4: calculando a probabilidade de cauda 

O passo final e estimar a probabilidade de obter DIF obs ou um valor mais extre- 
mo, visto que a hipotese nula e verdadeira [P(dados|H 0 )]. Para fazer isso, exami¬ 
ne o conjunto de valores simulados de DIF (histograma da Figura 5.3) e conte 
quantas vezes a DIF obs foi maior que, igual a, ou menor que cada um dos valores 
de DIF, lm . 

Em 29 de 1.000 randomiza 9 oes, DIF sim = DIF obs , entao a probabilidade de 
obter a DIF obs sob a hipotese nula e de 20/1.000 = 0,029 (Tabela 5.6). Contudo, 
quando calculamos uma estatlstica-teste, em geral nao estamos tao interes- 
sados na probabilidade exata quanto na probabilidade em cauda. Ou seja, 
queremos saber as chances de obter uma observa«;ao grande como ou maior 
que os dados reais, desde que a hipotese nula seja verdadeira. Em 7 de 1.000 
randomiza^oes, DIF sim > DIF obs . Deste modo, a probabilidade de que DIF obs > 
3,75 e (7 + 29) / 1.000 = 0,036. Esta probabilidade em cauda e a frequencia de 
obter o valor observado (29/1.000) mais a de obter um resultado mais extremo 
( 7 / 1 . 000 ). 
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TABELA 5.6 

Calculo da probabilidade em cauda 
na analise de Monte Carlo 

Desigualdade 

N 

DIF sim > DIF obs 

7 

DIF sim = DIF obs 

29 

DIF sim <DIF obs 

964 


Compara^oes da DIF obs (diferen^a absoluta entre a media dos dois grupos com os dados originais) com as 
DIF sim (difereru^a absoluta na media dos dois grupos apos a randomiza<;ao das atribui<;6es dos grupos). N 
e o numero de simulates (de 1.000) para os quais a desigualdade foi obtida. Como a DIF sim > DIF obs em 
7+29 = 36 simulates de 1.000, a probabilidade em cauda sob a hipotese nula de encontrar uma DIF obs 
neste extremo e de 36/1.000 = 0,036. 


Siga os procedimentos e as interpreta^oes dos valores de P que discutimos no 
Capitulo 4. Com uma probabilidade em cauda de 0,036, esses dados nao teriam 
ocorrido caso a hipotese nula fosse verdadeira. 

Premissas do metodo de Monte Carlo 

Os metodos de Monte Carlo recaem sobre tres premissas: 

1. Os dados coletados representam amostras aleatorias e independentes. 

2. A estatistica-teste descreve o padrao de interesse. 

3. A randomiza^ao cria uma distribui^ao nula apropriada para a questao. 

As premissas 1 e 2 sao comuns a todas as analises estatisticas. A 1 e a mais cri- 
tica, mas e tambem a mais dificil de se confirmar, como discutiremos no Capitulo 
6. A 3 e facil de se satisfazer neste caso. A estrutura amostral e a hipotese nula sen- 
do testadas sao muito simples. Para questoes mais complexas, contudo, o metodo 
de randomiza^ao apropriado pode nao ser obvio e, sim, haver mais de uma forma 
de construir a distribui<;ao nula (Gotelli & Graves, 1996). 

Vantagens e desvantagens do metodo de Monte Carlo 

A principal vantagem do metodo de Monte Carlo e que ele deixa claras e explici- 
tas as premissas subjacentes e a estrutura da hipotese nula. Em contraste, anali¬ 
ses parametricas convencionais frequentemente ofuscam essas funcionalidades, 
talvez porque os metodos sejam muito familiares. Outra vantagem do metodo 
de Monte Carlo sobre as analises parametricas e que ele nao requer a premissa 
de que os dados foram amostrados de uma distribui<;ao especifica, como a nor¬ 
mal. Por fim, as simulates de Monte Carlo permitem que voce personalize seu 
teste estatistico para questoes e conjuntos de dados em particular, em vez de ter 
que for^a-los em um teste convencional que pode nao ser o mais eficaz para sua 
questao, ou cujas premissas podem nao corresponder ao delineamento amostral 
de seus dados. 
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A principal desvantagem do metodo de Monte Carlo e que ele requer com- 
puta^o intensiva e nao e incluido na maioria dos pacotes estatisticos tradicionais 
(ver, porem, Gotelli & Entsminger, 2003). Conforme os computadores se tornam 
mais rapidos, antigas limita 9 oes dos metodos computacionais estao desapare- 
cendo e nao ha razao para que mesmo analises estatisticas muito complexas nao 
possam ser executadas com uma simula 9 ao de Monte Carlo. No entanto, ate que 
tais rotinas se tornem amplamente disponiveis, os metodos de Monte Carlo estao 
disponiveis apenas para aqueles que sabem uma linguagem de programa 9 ao e 
podem escrever seus proprios programas. 4 

Uma segunda desvantagem das analises de Monte Carlo e psicologica. Al- 
guns cientistas sao receosos acerca desses metodos porque diferentes analises do 
mesmo conjunto de dados podem produzir respostas um pouco diferentes. Por 
exemplo, nos re-executamos a analise sobre os dados da Tabela 5.1 dez vezes e 
obtivemos valores de P que variaram de 0,030 ate 0,046. A maioria dos pesqui- 
sadores prefere as analises parametricas, que sao mais objetivas e resultam no 
mesmo valor de P cada vez que a analise e repetida. 

A ultima desvantagem e que o dominio de uma inferencia para uma analise 
de Monte Carlo e subitamente mais restritivo que para uma do tipo parametrica, 
que assume uma distribu^ao especificada e permite inferencias acerca da popu- 
la 9 ao de origem subjacente, a partir da qual os dados foram amostrados. Estrita- 
mente falando, as inferencias dos metodos de Monte Carlo (pelo menos aquelas 
com base em simples testes de randomiza 9 ao) sao limitadas aos dados especificos 
coletados. Contudo, se uma amostra e representativa da popula 9 ao de origem, os 
resultados podem ser cuidadosamente generalizados. 


4 Uma das coisas mais importantes que voce pode fazer e reservar um tempo para aprender uma 
linguagem de programa^ao de verdade. Apesar de alguns individuos serem proficientes na progra- 
ma^ao de macros em planilhas, os macros sao praticos apenas para os calculos mais elementares; 
para coisas mais complexas, e mais simples escrever algumas linhas de codigos de computador 
do que lidas com os passos convolutos (e propensos a erro) necessarios para escrever macros. 
Na atualidade existem muitas linguagens de computador para voce escolher entre elas. O Gotelli 
prefere Delphi, que e uma versao de alto nlvel de Pascal com uma interface de usuario grafica; o 
Ellison prefere S-Plus ou sua versao livre, R, que inclui muitas fun^oes matematicas e estatisticas. 
Infelizmente, aprender a programar e como aprender uma lingua estrangeira - leva tempo e pra- 
tica, e nao ha uma recompensa imediata. E lamentavel, mas nossa cultura academica nao encoraja 
o aprendizado de habilidades de programa<;ao (ou outras linguas que nao o portugues). Mas se 
voce quiser superar a ingreme curva do aprendizado, a recompensa cientifica e grande. A melhor 
forma de come^ar nao e tomar aulas, mas adquirir um software de linguagem, trabalhar ao longo 
dos exemplos do manual, e entao come<;ar com um problema que o interesse. O livro The Ecolo¬ 
gical Detective (1997), de Hilborn e Mengel, contem uma excelente serie de exercicios ecologicos 
para exercitar suas habilidades de programa^ao. Programar nao somente ira livra-lo da cadeia dos 
softwares enlatados, mas tambem agu^ar suas habilidades analiticas e lhe dar novos insights em 
modelos ecologicos e estatisticos. Voce tera um entendimento profundo de um modelo ou de uma 
estatistica, desde que os tenha programado com sucesso. 
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ANALISES PARAMETRICAS 

As analises parametricas referem-se ao grande corpo de teorias e testes estatis- 
ticos construidos sob a premissa de que os dados analisados foram amostrados 
de uma distributee) especifica. A maioria dos testes estatisticos familiares aos 
ecologos e cientistas da area ambiental especifica a distribui^ao normal. Os pa- 
rametros da distribui^ao (p. ex., as medias da popula^ao pea variancia a 2 ) sao 
estimados e usados para calcular a probabilidade de cauda para uma hipotese 
nula verdadeira. Uma grande estrutura estatistica tern sido construida acerca da 
premissa simplista da normalidade dos dados. Praticamente 80% a 90% do que 
e ensinado nos textos-padrao de estatistica recaem sob esse tema. Aqui, usamos 
um metodo parametrico comum, a analise de variancia (ANOVA) para testar 
diferen^as entre a media dos grupos para os dados amostrais." Existem tres pas- 
sos na analise parametrica: 

1. Especifique a estatistica-teste. 

2. Especifique a distribui^ao nula. 

3. Calcule a probabilidade de cauda. 

Passo 1: especificando a estatistica-teste 

A analise de variancia parametrica assume que os dados foram tirados de uma 
distribui^ao normal, ou gaussiana. A media e a variancia dessas curvas podem 
ser estimadas a partir dos dados amostrais (Tabela 5.1), usando as Equates 3.1 
e 3.9. A Figura 5.4 mostra as distributees usadas na analise de variancia para¬ 
metrica. Os dados originais sao arranjados no eixo-x e cada cor representa um 
habitat diferente (circulos pretos para as amostras da floresta e circulos verdes 
para as do campo). 

Primeiro, considere a hipotese nula: que ambos os conjuntos de dados foram 
tirados de uma distributao normal subjacente unica, estimada a partir da media 


5 O arcabou^o da teoria estatistica parametrica moderna e amplamente desen- 
volvida pelo notavel Sir Ronald Fisher (1890-1962), e a razao-F e nomeada 
em sua honra (embora o proprio Fisher ache que essa razao precisava de mais 
estudos e refinamentos). Fisher recebeu a cadeira de honra de Genetica na 
Cambridge University, de 1943 a 1957, e fez contributes fundamentais para 
as teorias de genetica de populates e evolu^ao. Na estatistica, ele desenvolveu 
a analise de variancia (ANOVA) para analisar a produ^ao de cultivos em siste- 
mas de agricultura, em que pode ser dificil ou impossivel replicar os tratamen- 
tos. Hoje, muitas das mesmas restri^oes desafiam os ecologos no delineamento 
de seus experimentos, por isso os metodos de Fisher continuam tao uteis. Seu 
livro classico, The Design of Experiments (1935), ainda e uma leitura agradavel e que vale a pena. E 
ironico pensar que Fisher tenha ficado preocupado acerca de seus proprios metodos ao lidar com 
experimentos que ele podia delinear bem, enquanto hoje muitos ecologos aplicam os metodos dele 
para avaliar observances de experimentos naturais maldelineados (ver Capitulos 4 e 6). (A fotografia 
e cortesia do Memorial de Ronald Fisher.) 








136 Nicholas J. Gotelli e Aaron M. Ellison 


e da variancia de todos os dados (linha pontilhada; media = 8,5, desvio-padrao 
= 2,54). A hipotese alternativa e de que as amostras foram tiradas de duas po¬ 
pulates diferentes, cada uma delas pode ser caracterizada por uma distribui^ao 
normal diferente, uma para floresta e outra para campo. Cada distribute) tern 
sua propria media, embora assumamos que a variancia e a mesma (ou similar) 
para cada um dos grupos. Essas duas curvas tambem sao ilustradas na Figura 5.4, 
usando as estatisticas descritivas calculadas na Tabela 5.2. 

Como a hipotese nula e testada? Quanto mais proximas as curvas para os 
dados de floresta e campo, mais provavel e que os dados tenham sido coletados 
visto que a hipotese nula e verdadeira, e a linha pontilhada melhor os repre- 
senta. Inversamente, quanto mais separadas forem as curvas, mais improvavel 
e que os dados representem uma unica popula^ao como media e variancia 
comuns. A area sobreposta entre as duas distributes (sombreada, na Figura 
5.4) deveria ser uma medida de quao proximo ou quao distante as distribu¬ 
tes estao. 

A contribui^ao de Fisher foi de quantificar essa sobreposi<;ao como a razao 
das duas variaveis. A primeira e a quantidade de varia^ao entre grupos, que po- 



Figura 5.4 Distributees normais fundamentadas nos dados amostrais da Tabela 5.1 . Os dados 
da Tabela 5.1 sao mostrados como sfmbolos (circulos pretos, amostras de floresta; circulos verdes, 
amostras de campo) indicatives do numero de formigueiros registrados em cada parcela. A hipo¬ 
tese nula e de que todos os dados foram tirados da mesma populagao, cuja distribuigao normal 
e mostrada com a linha pontilhada. A hipotese alternativa e de que cada habitat tern sua propria 
media (e variancia) distintas, indicadas pelas duas distributees normais menores. Quanto menor 
a sobrepostao sombreada das duas distributees, mais improvavel que a hipotese nula seja verda¬ 
deira. As medidas de varia^ao entre e dentro dos grupos sao usadas para calcular a razao-F e testar 
a hipotese nula. 
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demos pensar como a variancia (ou o desvio-padrao) das medias dos dois gru- 
pos. A segunda e a quantidade de varia^ao dentro de cada grupo, que podemos 
pensar como a variancia das observances em torno de suas respectivas medias. A 
razao-F de Fisher pode ser interpretada como a existente entre essas duas fontes 
de varia^ao: 

F= (variancia entre grupos + variancia dentro dos grupos) / variancia dentro dos grupos (5.1) 

No Capitulo 10, explicaremos em detalhes como calcular o numerador e o 
denominador da razao-F. Por enquanto, apenas enfatizaremos que a razao mede 
o tamanho relativo das duas fontes de varia^ao nos dados: varia^ao entre gru¬ 
pos e varia^ao dentro dos grupos. Para esses dados, a razao-F e calculada como 
33,75/3,84 = 8,78. 

Em uma ANOVA, a razao-F e a estatistica-teste que descreve (com um unico 
numero) o padrao das diferen<^as entre as medias dos diferentes grupos sob com- 
paranao. 

Passo 2: especificando a distribui^ao nula 

A hipotese nula e de que todos os dados foram tirados da mesma popula^ao, 
de forma que quaisquer diferen^as entre as medias dos dois grupos nao sejam 
maiores que esperado ao acaso. Se essa hipotese nula for verdadeira, entao a va- 
rianao entre grupos sera pequena, e esperamos encontrar uma razao-F de 1,0. A 
razao-F sera correspondentemente maior que 1,0 se as medias dos grupos estao 
muito separadas (grande varia^ao entre grupos) em relat^ao a variat^ao dentro 
dos grupos. 6 Neste exemplo, a razao-F de 8,78 e quase 10 vezes maior que o valor 
esperado de 1,0, um resultado que parece improvavel caso a hipotese nula fosse 
verdadeira. 

Passo 3: calculando a probabilidade de cauda 

O valor de P e uma estimativa da probabilidade de obter uma razao-F > 8,78, dado 
que a hipotese nula fosse verdadeira. A Figura 5.5 mostra a distribui^ao teorica da 
razao-F e a razao-F observada de 8,78, que esta no extremo da cauda direita da 
distribui^ao. Qual e sua probabilidade de cauda (ou valor de P)? 

O valor de P dessa razao-F e calculado como a massa de probabilidade da dis- 
tribuinao da razao-F (ou area sob a curva) igual ou maior que a razao-F observa¬ 
da. Para esses dados, a probabilidade de obter uma razao-F tao grande ou maior 
que 8,78 (dados dois grupos e um N total de 10) e igual a 0,018. Como o valor de 


6 Como na analise de Monte Carlo, existe uma possibilidade teorica de obter uma razao-F que e me- 
nor que o esperado ao acaso. Assim, as medias dos dois grupos sao inusitadamente similares e dife- 
rem menos que o esperado, se a hipotese nula fosse verdadeira. As razoes-F inusitadamente pequenas 
raras vezes sao vistas na literatura ecologica, embora Schluter (1990) as tenha usado como um indice 
de concordancia do tamanho corporal entre especies e para convergencia da comunidade. 
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Figura 5.5 Distribuigao-F teorica. Quanto maior a razao-F observada, mais improvavel ela seria 
caso a hipotese nula fosse verdadeira. 0 valor cri'tico para essa distribuigao e igual a 5,32; a area sob 
a curva alem deste ponto e igual a 5% de toda area sob a curva. A razao-F observada de 8,78 esta 
alem do valor crftico, assim Pfdados das formigas | hipotese nula) < 0,05. De fato, a verdadeira pro- 
babilidade P(dados das formigas | hipotese nula) = 0,018, pois a area sob a curva a direita da razao-F 
observada representa 1,8% da area total sob a curva. Compare esse resultado ao valor de P de 0,036 
da analise de Monte Carlo (Figura 5.3). 


P e menor que 0,05, consideramos improvavel que uma razao-F tao alta ocorra 
apenas por acaso, e rejeitamos a hipotese nula de que nossos dados tenham sido 
amostrados de uma unica popula^ao. 

Premissas do metodo parametrico 

Existem duas premissas para todas as analises parametricas: 

1. Os dados coletados represen tarn amostras aleatorias e independentes. 

2. Os dados foram amostrados de uma distribui<;ao especifica. 

Como vimos, a primeira premissa de amostragem aleatoria e independente 
para as analises de Monte Carlo e sempre a mais importante em qualquer outra. A 
segunda premissa normalmente e satisfeita, porque distributes normais (forma 
de sino) sao ubiquas e ocorrem com frequencia no mundo real. 

Testes parametricos espedficos normalmente incluem premissas adicionais. 
Por exemplo, a ANOVA ainda assume que a variancia dentro de cada grupo sob 
compara^ao e igual (ver Capitulo 10). Se o tamanho amostral e grande, tal pre¬ 
missa pode ser modestamente violada e os resultados ainda assim serao robustos. 
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Porem, se o tamanho amostral for pequeno (como neste exemplo) essa premissa 
e mais importante. 

Vantagens e desvantagens do metodo parametrico 

A vantagem do metodo parametrico e que ele utiliza um arcabou^o poderoso 
com base em distributes de probabilidade conhecidas. A analise que apresenta- 
mos foi muito simples, mas existem muitos testes parametricos apropriados para 
delineamentos experimentais e amostrais complexos (ver Capitulo 7). 

Embora a analise parametrica seja intimamente associada ao teste da hi- 
potese nula estatistica, ela pode nao ser tao poderosa quanto os sofisticados 
modelos de Monte Carlo, que sao adaptados a questoes ou dados particulares. 
Em contraste a analise bayesiana, a parametrica raras vezes incorpora infor- 
ma^ao a priori ou resultados de outros experimentos. As analises bayesianas 
serao alvo do proximo topico - apos um breve desvio pelas estatisticas nao 
parametricas. 

Analises nao parametricas: um caso especial de analise de Monte Carlo 

As estatisticas nao parametricas tern base na analise de dados ranqueados. No 
exemplo das formigas, poderiamos ranquear as observances da maior para a me- 
nor e, entao, calcular estatisticas com base nas somas, nas distributes ou em ou- 
tras medidas sinteticas desses ranques. Analises nao parametricas nao assumem 
uma distribui^ao parametrica especifica (dai o nome), mas elas ainda requerem 
amostras independentes e aleatorias (como todas as analises estatisticas). Um tes¬ 
te nao parametrico, em essencia, e uma analise de Monte Carlo de dados ranque¬ 
ados, e tabelas estatisticas nao parametricas fornecem valores de P que poderiam 
ser obtidos por testes de randomizanao de ranques. Portanto, ja descrevemos a 
logica e os procedimentos gerais para esses testes. 

Embora elas em geral sejam usadas por ecologos e cientistas da area am- 
biental, nao somos a favor das analises nao parametricas por tres razoes. Pri- 
meiro, o uso de dados ranqueados desperdi^a informanoes que estao presentes 
nas observances originais. Uma analise de Monte Carlo dos dados brutos e bem 
mais informativa e, com frequencia, mais poderosa. Uma justificativa que e dada 
para o uso de uma analise nao parametrica e que os dados ranqueados podem 
ser mais robustos aos erros de medidas. Contudo, se as observances originais sao 
tao propensas a erro que somente os ranques sejam confiaveis, provavelmen- 
te uma boa ideia seja refazer o experimento usando metodos de mensuranao 
que oferenam melhor acuracia. Segundo, relaxar com a premissa de uma dis¬ 
tribute parametrica (p. ex., normalidade) nao e uma grande vantagem, pois 
as analises parametricas muitas vezes sao robustas as violanoes dessa premissa 
(granas ao Teorema do Limite Central). Terceiro, os metodos nao parametricos 
sao disponiveis apenas para delineamentos experimentais muito simples e nao 
podem incorporar com facilidade covariaveis ou estruturas em bloco. Temos 
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observado que praticamente todas as necessidades de andlises estatisticas de da¬ 
dos ecologicos e ambientais podem ser satisfeitas por abordagens parametricas, 
de Monte Carlo e bayesianas. 

ANALISES BAYESIANAS 

A analise bayesiana e a terceira maior estrutura para analises de dados. Os cien- 
tistas com frequencia acreditam que seus metodos sao “objetivos”, pois tratam 
cada experimento como uma tdbula rasa: a simples hipdtese nula estatistica 
de varia^'ao aleatoria reflete a ignorancia acerca da causa e do efeito. Em nosso 
exemplo da densidade de formigueiros em florestas e campos, nossa hipbtese 
nula era a de que os dois sao iguais, ou de que o fato de estar na floresta ou no 
campo nao possui nenhum efeito consistente da densidade de formigueiros. 
Apesar de ser possivel que ninguem nunca tenha investigado isso, trata-se de 
algo extremamente improvdvel; nossa revisao da literatura sobre biologia de 
formigas que nos levou a realizar este estudo especifico. Entao, por que nao 
usar dados que ja existem para formular nossas hipoteses? Se nosso unico ob- 
jetivo £ o hipot^tico-dedutivo de falsear uma hipotese nula, e todos os dados 
pr^vios indicam que florestas e campos diferem na densidade de formigueiros, 
e muito provdvel que nos, tamb^m, falsearemos a hipotese nula. Dessa forma, 
nao precisariamos gastar tempo e energia fazendo o estudo novamente. 

Os bayesianos argumentam que poderiamos progredir mais especificando a 
diferen^a observada (p. ex., expressada como a DIF ou a estatistica-F descrita nas 
sessoes anteriores), e entao usar nossos dados para ampliar os resultados ante- 
riores de outros pesquisadores. A analise bayesiana nos permite fazer exatamente 
isso, bem como quantificar a probabilidade da diferen^a observada. Eis a diferen- 
<;a mais importante entre os metodos bayesiano e frequentista. 

Existem seis passos na inferencia bayesiana: 

1. Especificar a hipotese. 

2. Especificar os parametros como varidveis aleatorias. 

3. Especificar a probabilidade a priori. 

4. Calcular a verossimilhan<ja. 

5. Calcular a distribui(;ao de probabilidades a posteriori. 

6. Interpretar os resultados. 

Passo 1: especificando a hipotese 

O objetivo primario da analise bayesiana £ determinar a probabilidade da hipo¬ 
tese aplicatuio os dados que foram coletados: P(H|dados). A hipotese precisa ser 
bastante especifica, e quantitativa. Em nossa analise parametrica da densidade 
de formigueiros, a hipotese de interesse (i. e., a hipbtese alternativa) foi que as 
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amostras foram tiradas de duas populates com medias diferentes e mesma va- 
riancia, uma para lloresta e outra para campo. Nao testamos essa hipdtese dire- 
tamente. Em vez disso, testamos a hipdtese nula: o valor observado do F nao era 
maior que o esperado caso as amostras fossem tiradas de uma unica popula^ao. 
Encontramos que a razao-F observada era bastante improvdvel (P = 0,018) e 
rejeitamos a hipotese nula. 

Poderiamos especificar com mais precisao a hipotese nula e a alternativa acer- 
ca do valor da razao-F. Antes de podermos especificar essas hipoteses, precisamos 
saber o valor critico para distribui^ao-F na Figura 5.5. Em outras palavras, quao 
grande um valor de F precisa ser para ter um valor de P < 0,05? 

Para 10 observances de formigas em dois grupos (campo e lloresta), o valor 
critico da distribuinao-F (i. e., o valor para o qual a area sob a curva £ igual a 5% 
da area total) £ igual a 5,32 ( ver Figura 5.5). Assim, qualquer razao-F observada 
que seja maior ou igual a 5,32 seria motivo para rejeitar a hipotese nula. Lembre- 
-se de que o metodo hipotetico-dedutivo geral declara que a probabilidade da hi¬ 
potese nula £ P(dados|H 0 ). No exemplo dos formigueiros, os dados resultaram em 
uma razao-F igual a 8,78. Se a hipotese nula for verdadeira, a razao-F observada 
deveria ser uma amostra aleatdria da distribuinao F mostrada na Figura 5.5. Por 
essa razao, questionamos o que e P(F obi = 8,78 | F I<<3rjc J? 

Em contraste, a analise bayesiana procede invertendo essa declaranao de pro¬ 
babilidade: qual e a probabilidade da hipotese a plica mb os dados que coletamos 
[P(H | dados)]? Os dados dos formigueiros podem ser expresses como F = 8,78. 
Como as hipoteses seriam expressas em termos da distribuinao-F? A hipotese nula 
6 de que os formigueiros foram amostrados de uma unica populanao. Neste caso, 
o valor esperado para a razao-F e pequeno (F < 5,32, o valor critico). A hipotese 
alternativa £ de que os formigueiros foram amostrados de duas populates, na 
qual a razao-F seria grande (F = 5,32). Portanto, a analise bayesiana da hipotese 
alternativa calcula P(F > 5,32 | F^ = 8,78). Pelo Primeiro Axioma da Probabilida- 
dc. P( F < 5,32 | F 0 J = 1 - P(F > 5,32 | F„J. 

Uma modifican'ao do Teorema de Bayes (apresentada no Capitulo 1) nos per- 
mite calcular diretamente P(hipotese | dados): 

P(hipotese | dados) = P( hipotese) P(dados ] hipotese) ( 5>2 ) 

P( dados) 


Na Equa^ao 5.2, P(hipotese | dados) no lado esquerdo da equa^ao £ chamada 
de distribuinao de probabilidade a posteriori (ou simplesmente os posteriores), e 
£ a quantidade de interesse. O lado direito da equanao consiste em uma franao. No 
numerador, o termo P(hipotese) e tratado como distribuinao de probabilidades 
a priori (ou simplesmente os priores), e e a probabilidade da hipotese de interes- 
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se antes de conduzir o experimento. O proximo termo no numerador, P( dados | 
hipotese), e tratado como a verossimilhan^a dos dados; ele reflete a probabilida- 
de de observar os dados conforme a hipotese. 7 O denominador, P( dados), e uma 
constante de normaliza^ao que reflete a probabilidade dos dados de acordo com 
todas as hipoteses possiveis. 8 Como ela e simplesmente uma constante de normali- 
za 9 ao (e coloca a probabilidade a posteriori em uma escala que varia entre [0,1]), 

P(hipotese | dados) °c P(hipotese) P(dados | hipotese) 

(onde °c significa “e proporcional a”) e podemos focar nossa aten^ao ao nu¬ 
merador. 

Retornando as formigas e as razoes-F, detemo-nos em P(F > 5,32 | F obs = 8,78). 
Agora ja especificamos quantitativamente nossa hipotese nos termos da rela^ao 
entre a razao-F que observamos (os dados) e o valor critico de F > 5,32 (a hipo¬ 
tese). Trata-se de uma hipotese mais precisa do que a discutida nas duas sessoes 
anteriores, de que existe uma diferen^a entre a densidade de formigas em campos 
e em florestas. 

Passo 2: especificando os parametros como variaveis aleatorias 

Uma segunda diferen^a fundamental entre as analises frequentista e bayesiana e 
que, na primeira, os parametros (como a verdadeira media das populates p floresta 


7 Fisher desenvolveu o conceito de verossimilhan^a ( likelihood ) em resposta ao seu desconforto com 
os metodos bayesianos de probabilidade inversa: 

O que tern parecido e que o conceito matemdtico de probabilidade e inadequado para expres- 
sar nossa confian$a, ou desconfian$a, mental ao fazer tais inferencias , e que a quantidade 
matematica que parece ser apropriada para medir a nossa ordem de preferencia entre di- 
ferentes populates posstveis de fato ndo obedece as leis da probabilidade. Para distingui-la 
da probabilidade , eu tenho usado o termo “verossimilhan$a” para designar essa quantidade. 

(Fisher , 1925, p. 10). 

A verossimilhan^a e representada como L(hipotese | dados) e e diretamente proporcional (mas 
nao igual) a probabilidade dos dados observados dada a hipotese de interesse: L(hipotese | dados) 
= cP(dados obs | hipotese). Desta forma, a verossimilhan^a difere do valor de P frequentista, pois o 
valor de P expressa a probabilidade das infmitamente possiveis amostras de dados de acordo com a 
hipotese nula estatistica (Edwards, 1992). A verossimilhan^a e usada extensivamente em abordagens 
que usam teoria de informa^ao na inferencia estatistica (p. ex., Hilborn & Mangel, 1997; Burnham 
& Anderson, 2002), e e uma parte central da inferencia bayesiana. Entretanto, a verossimilhan<;a nao 
segue os axiomas da probabilidade. Como a linguagem da probabilidade e uma forma mais consis- 
tente de expressar nossa confian^a em um determinado resultado, sentimos que as probabilidades 
de diferentes hipoteses (presentes na escala de 0 a 1) sao interpretadas com mais facilidade que as 
verossimilhan^as (ausentes). 

s O denominador e calculado como: 

JP(H,)P(dados| Hj)dH 
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e M’campo’ seus desvios-padrao a 2 , ou a razao-F) saofixos. Em outras palavras, assu- 
mimos que ha um valor verdadeiro para a densidade de formigueiros em campos e 
florestas (ou ao menos nos campos e nas florestas que amostramos), e estimamos 
aqueles parametros a partir de nossos dados. Em contraste, a analise bayesiana 
considera esses parametros como sendo variaveis aleatdrias, com seus proprios 
parametros associados (p. ex., medias e variancias). Assim, por exemplo, em vez 
da media da popula<;ao de colonias de formigas em campo ser um valor fixo 
M-campo’ ela pode ser expressa como uma variavel aleatoria com sua propria media 
e variancia: |J. campo ~N(X campo , O 2 ). Note que a variavel aleatoria representando as 
colonias de formigas nao precisa ser normal. O tipo de variavel aleatoria usada 
para cada parametro da popula^ao deve refletir a realidade biologica, e nao uma 
conveniencia matematica ou estatistica. Nesse exemplo, contudo, e razoavel des- 
crever a densidade de colonias de formigas como uma variavel aleatoria normal: 

M'campo ^ ( ^'campo’ ^ ) > M"fl oresta ~N(A, floresta , o ). 

Passo 3: especificando a distribui^ao de probabilidades de priores 

Como nossos parametros sao variaveis aleatorias, eles possuem distributes de 
probabilidades associadas. Nossas medias desconhecidas das populates (os ter- 
mos A, campo e A, floresta ) possuem distribui^ao normal, associados a media e variancia 
desconhecidas. Para fazer os calculos requeridos pelo Teorema de Bayes, precisa- 
mos especificar a distribui^ao de probabilidade de priores para esses parametros - 
ou seja, qual e a distribui<;ao de probabilidade para essas variaveis aleatorias antes 
de fazermos o experimento? 9 

Temos duas escolhas basicas para especificar a priori. Primeiro, podemos 
vasculhar e reanalisar dados na literatura, falar com especialistas e chegar a 
estimativas razoaveis para a densidade de formigueiros em campos e florestas. 
Como alternativa, podemos usar uma priore nao informativa, para a qual ini- 
cialmente estimamos a densidade de formigueiros como sendo igual a zero e a 
variancia como sendo muito grande. (Neste exemplo, estipulamos a variancia 
como sendo igual a 100.000.) Usando uma priore nao informativa equivale a 
dizer que nos nao temos nenhuma informa^ao a priori, e que a media pode 


9 A especifica^ao da priores e uma divisao fundamental entre frequentistas e bayesianos. Para 
um frequentista, especificar uma priore reflete subjetividade por parte do investigador, e assim 
o uso de uma priore e considerado nao cientifico. Os bayesianos arguem que especificar uma 
priore torna explicitas todas as premissas escondidas de um investigador, e por isso e uma abor- 
dagem mais honesta e objetiva de fazer ciencia. Esse argumento durou por seculos (ver revisao 
em Effron, 1986, e em Berger & Berry, 1988), e foi uma das razoes para a marginaliza^ao dos 
bayesianos dentro da comunidade cientifica. Contudo, o advento das modernas tecnicas de com- 
putacionais permitiu que os bayesianos trabalhassem com priores nao informativas, como as que 
usamos aqui. Acontece que, com priores nao informativas, os resultados bayesianos e frequen¬ 
tistas sao muito similares, apesar de sua interpreta^ao final permanecer diferente. Tais avan^os 
levaram a uma recente renascen^a na estatistica bayesiana, embora um software simples e facil de 
usar ainda nao exista. 
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assumir praticamente qualquer valor com probabilidade aproximadamente 
igual. 10 E claro, no caso de haver mais informa<;ao, voce pode ser mais esped- 
fico com sua priore. A Figura 5.6 ilustra a priore nao informativa e uma mais 
informativa (hipotetica). 

Similarmente, o desvio-padrao a para p campo e p. floresta tambem possui uma 
distribui<;ao de probabilidades a priori. A inferencia bayesiana em geral espe- 
cifica uma distribuiqio gamma inversa * 11 para as variancias; como com os prio- 
res da media, usamos priores nao informativos para variancia. Escrevemos isso 
simbolicamente como a 2 ~ GI( 1.000, 1.000) (le-se “a variancia e distribuida 
como uma distribui^ao gamma inversa com parametros 1.000 e 1.000”). Tam¬ 
bem calculamos a precisao de nossa estimativa da variancia, que simbolizamos 
como x, onde x = 1/a 2 . Aqui, x e uma variavel aleatoria gamma (o inverso de 
uma gamma inversa e uma gamma), e escrevemos isso simbolicamente como 
X ~r(0,001, 0,001) (le-se “tau e distribuido como uma distribui^ao gamma com 
parametros 0,001,0,001”). A forma dessa distribui^ao e ilustrada na Figura 5.7. 
O uso dessa precisao deve fazer algum sentido intuitivo; como nossa estimativa 
da variabilidade decresce quando temos mais informa^oes, a precisao de nossa 
estimativa aumenta. Assim, um valor alto de precisao equivale a uma baixa va¬ 
riancia do nosso parametro estimado. 


" Voce pode se questionar por que nao usamos uma distribui^ao uniforme, na qual todos os valores 
tern a mesma probabilidade. A razao e que a distribu i^ao uniforme e uma priore impropria. Como a 
integral de uma distribui^ao uniforme e indefmida, nao podemos usa-la para calcular a distribui^ao 
a posteriori do Teorema de Bayes. A priore nao informativa N(0,100.000) e praticamente uniforme 
sobre uma grande parte, mas ela pode ser integrada. Ver Carlin e Louis (2000) para uma discussao 
adicional sobre priores improprios e nao informativos. 

11 A distribui^ao gamma para precisao e a gamma inversa para variancia sao utilizadas por duas ra- 
zoes. Primeiro, a precisao (ou variancia) precisa assumir apenas valores positivos. Assim, qualquer 
fun^ao de densidade de probabilidade que tenha apenas valores positivos pode ser usada para pre¬ 
cisao e variancia das priores. Para variaveis continuas, tais distributes incluem uma distribui^ao 
uniforme que e restrita aos numeros positivos e a distribui^ao gamma. Esta e um tanto mais flexivel 
que aquela e permite uma melhor incorpora^ao do conhecimento a priori. 

Segundo, antes do uso de computa<;ao de alta velocidade, a maioria das analises bayesianas era 
realizada utilizando analises conjugadas. Em uma analise conjugada, a distribui^ao de probabilidades 
a priori e solicitada de maneira que tenha a mesma forma que a distribui^ao de probabilidades a pos¬ 
teriori. Essa conveniente propriedade matematica permite uma solu^ao de forma fechada (analitica) 
para a complexa integra^ao envolvida no Teorema de Bayes. Para dados que seguem a distribui^ao 
normal, a priore conjugada para o parametro que especifica a media e uma distribui^ao normal, e a 
priori conjugada para o parametro que especifica a precisao (= 1/variancia) e uma distribui^ao gama. 
Para dados que seguem a distribui^ao de Poisson, a distribui^ao gamma e a priore conjugada para 
o parametro que define a media (ou taxa) da distribui^ao de Poisson. Para uma discussao adicional, 
ver Gelman et al. (1995). 

A distribui^ao gamma possui dois parametros, escritos como V{a y b ), onde a e tratado como o 
parametro de forma ebeo parametro de escala. A fun^ao densidade de probabilidade da distribui^ao 
gamma e: 


( Continua ) 




Prindpios de Estati'stica em Ecologia 145 



Figura 5.6 Distribui^ao de probabilidades a priori para analise bayesiana. Essa analise requer 
a especificagao da distribui^ao de probabilidades a priori para os parametros estati'sticos de in- 
teresse. Na analise dos dados daTabela 5.1, o parametro e a densidade media deformigueiros, 
K. Come^amos com uma simples distribui^ao de probabilidades a priori nao informativa de 
que a densidade media de formigueiros e descrita por uma distribui^ao normal com media 0 
e desvio-padrao de 100.000 (curva verde). Como o desvio-padrao e muito grande, a distribui- 
$ao e praticamente uniforme sobre uma grande amplitude de valores entre -1.500 e +1.500, 
a probabilidade e essencialmente constante (-0,0002), que e apropriada como priore nao in¬ 
formativa. A curva preta representa uma distribui^ao de probabilidade a priori mais precisa. 
Como o desvio-padrao e muito menor (100), a probabilidade nao e mais constante ao longo de 
uma grande amplitude de valores, mas, em vez disso, ela decresce mais acentuadamente com 
valores extremos. 


11 


( Continuagao) 


P(X) = 


r W 


, para X > 0 


onde T(a) e a fun^ao gamma V(n) = (n - 1)! para inteiros n > 0. Generalizando, para os numeros 
reais z, a fun^ao gamma e definida como: 


Hz) = f ‘ 

J 0 


f 1 

'ini 

J 0 

t 


“ 12-1 


dt 


A distribui^ao gamma tern um valor de expectativa E(X) = alb e variancia = a/b 2 . Duas distribui- 
9 oes comumente utilizadas por estatisticos sao casos especiais da distribui(;ao gamma. A distribui^ao 
X 2 com v graus de liberdade e igual a T(v/2,0,5). A distribui^ao exponencial com parametro P discu- 
tida no Capitulo 2 e igual a r(l,p). 

Por fim, se a variavel aleatoria l/X ~ r(a,b), entao X e dito como tendo uma distribui^ao 
gamma inversa (GI). Para obter priores nao informativas da variancia de uma variavel aleatoria 
normal, tomamos o limite da distribui^ao GI, com a e b tendendo a 0. Essa e a razao pela qual 
usamos a = b = 0,001 como parametro a priori para a distribui^ao gamma que descreve a precisao 
da estimativa. 
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Figura 5.7 Distribuigao de probabilidade a priori nao informativa para a precisao (= 1/variancia). 
A inferencia bayesiana requer a especifica^ao nao apenas da distribui^ao de priores para a media 
da variavel (Figura 5.6), mas tambem uma especificagao para a precisao (= 1/variancia). A inferencia 
bayesiana em geral especifica uma distribute) gamma inversa para as variances. Da mesma forma 
como com a distribui^ao das medias, uma priore nao informativa e usada para a variancia. Neste 
caso, a variancia e distribuida como uma distribute* gamma inversa com parametros 1.000 e 1.000: 
a 2 ~ Gl (1,000,1,000). Como a variancia e muito grande, a precisao e pequena. 


Agora temos nossa distribui^ao de probabilidades a priori. As medias 
das populates desconhecidas de formigas em campos e em florestas, p campo 
e p floresta , sao ambas variaveis aleatorias normais com valores de expectativa 
iguais a \ ampo e A. floresta e variancias, G 2 , desconhecidas (mas iguais). Essas ex- 
pectativas das medias sao, por si so, variaveis aleatorias normais com valores 
esperados de 0 e variancia de 100.000. A precisao da popula^ao xeo reciproco 
da variancia da popula<;ao G 2 , e e uma variavel aleatoria gamma com parame¬ 
tros (0,001, 0,001): 

Pi ~ N(k j, G 2 ) 

^i~N(0,100,000) 

x = i/G 2 ~r(o.oo 1,0.001) 

Essas equates especificam completamente P(hipotese) do numerador da 
Equa^ao 5.2. Se tivessemos informa<;ao a priori verdadeira, tal como a den- 
sidade de formigueiros em outros campos e florestas, poderiamos usar esses 
valores para especificar com mais acuracia as medias e variancias esperadas 
para os A,. 
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Passo 4: calculando a verossimilhan^a 

A outra quantidade no numerador do Teorema de Bayes (Equa<;ao 5.2) e a ve- 
rossimilhan^a, P(dados obs | hipotese). A verossimilhan^a e uma distribui^ao pro- 
porcional a probabilidade dos dados observados conforme a hipotese. 12 Cada 
parametro \ e X de nossa distribui«;ao de probabilidade a priori tem sua pro¬ 
pria funqio de verossimilhan<;a. Em outras palavras, os diferentes valores de 
tem fun^oes de verossimilhan^a que sao variaveis aleatorias normais com media 
igual a observada (aqui, 7 formigueiros por parcela em florestas e 10,75 formi- 
gueiros por parcela em campos, ver Tabela 5.2). As variancias sao iguais as vari- 
ancias das amostras (4,79 em florestas e 2,25 em campos). O parametro X tem 
uma fun^ao de verossimilhan<;a, que e uma variavel aleatoria gamma inversa. 
Por ultimo, a razao-F e uma variavel aleatoria-F com valor de expectativa (ou 
estimativa de maxima verossimilhan^a) 13 igual a 8,78 (calculada a partir dos 
dados usando a Equa^ao 5.1). 

Passo 5: calculando a distribui^ao de probabilidad es a posteriori 

Para calcular a distribui^ao de probabilidades a posteriori, P(H | dados), aplica- 
mos a Equa«;ao 5.2, multiplicamos a priore pela verossimilhan^a, e dividimos pela 
constante de normaliza^ao (ou verossimilhan<;a marginal). Embora essa multi- 
plica<;ao seja simples para distributes com forma de sino, como a normal, os 
metodos computacionais sao usados para estimar iterativamente a distribui^ao a 
posteriori para qualquer distribui^ao de priores (Carlin e Louis, 2000). 


1_ Existe uma diferen^a-chave entre fun<;ao de verossimilhan^a e distribui<^ao de probabilidade. 
A probabilidade dos dados dada uma hipotese, P (dados | hipotese), e a de qualquer conjunto 
de dados aleatorios de acordo com uma hipotese espedfica, em geral a nula estatistica. A fun^ao 
densidade de probabilidade associada (ver Capitulo 2) conforma com o Primeiro Axioma da Pro¬ 
babilidade - de que a soma das probabilidades = 1. Em contraste, a verossimilhan^a e fundamen- 
tada em apenas um conjunto de dados (a amostra observada) e pode ser calculada para muitas 
hipoteses e parametros diferentes. Apesar de ser uma fun^ao que resulta em uma distribui^ao de 
valores, a distribui<;ao nao e de probabilidades, e a soma de todas as verossimilhan^as nao neces- 
sariamente soma 1. 

1 A maxima verossimilhan^a e o valor, para o nosso parametro, que maximiza a fun^ao de ve- 
rossimilhan^a. Para obte-lo, tome a derivada da verossimilhan^a, configure-o para 0, e a resolva 
para os valores dos parametros. As estimativas de parametros frequentistas em geral sao iguais 
as estimativas de maxima verossimilhan^a dos parametros das fun^oes de densidade de proba¬ 
bilidade especificadas. Fisher afirmou, em seu sistema de inferencia fiducial, que a estimativa da 
maxima verossimilhan^a fornece probabilidades realistas da hipotese alternativa (ou nula). Fisher 
fundamentou sua afirma^ao em um axioma estatistico que ele definiu como de acordo com os 
dados observados 7, a fun<;ao de verossimilhan<;a L(H | Y) contem todas as informa^oes relevantes 
acerca da hipotese H. Nao discutiremos, aqui, estimativas de maxima verossimilhan^a, pois (a) as 
tecnicas modernas de computa^ao normalmente as fornecem, em vez de valores assintoticos para 
as estatisticas frequentistas; e (b) os bayesianos usam a fun^ao de verossimilhan^a inteira em seus 
calculos. Para leitura adicional sobre metodos de verossimilhan^a, ver Berger & Wolpert (1984) e 
Edwards (1992). 
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Em contraste aos resultados das analises parametricas e de Monte Carlo, o 

resultado da analise bayesiana e uma distribuigdo de probabilidades, nao apenas 

um valor de P. Dessa forma, neste exemplo, expressamos P(F > 5,32 | F obs ) como 

uma variavel aleatoria com media e variancia esperadas. Para os dados da Tabela 

5.1, calculamos estimativas a posteriori para todos os parametros: A , A fl ., 
2 % 9 ^ # 
a' (= 1/x) (Tabela 5.7). Como usamos priores nao informativas, as estimativas 

dos parametros para as analises bayesiana e parametrica sao similares, embora 

nao identicas. 

A distribui^ao-F hipotetica com valor esperado igual a 5,32 e mostrada na 
Figura 5.8. Para calcular P(F > 5,32 | F obs ), simulamos 20.000 razoes-F usando um 
algoritmo de Monte Carlo. A media, ou valor esperado, de todas essas razoes-F e 
9,77; o numero e um pouco maior que a estimativa frequentista (maxima veros- 
similhan^a) de 8,78, porque nosso tamanho amostral e muito pequeno (N = 10). 
A dispersao ao redor da media e grande: SD = 7,495; por isso, a precisao de nossa 
estimativa e relativamente baixa (0,017). 

Passo 6: interpretando os resultados 

Agora retornamos a questao motivadora. Qual e a probabilidade de obter uma 
razao-F > 5,32, baseando-nos nos dados sobre a densidade de formigueiros da 
Tabela 5.1? Em outras palavras, o quanto e provavel que as medias da densidade 
de formigueiros dos dois habitats realmente sejam diferentes? Podemos respon¬ 
der essa questao de forma direta, perguntando qual a porcentagem de valores 
na Figura 5.8 e maior ou igual a 5,32. A resposta e 67,3%. Isso nao parece muito 
convincente quanto o valor de P = 0,018 (1,8%) obtido na analise parametrica da 
sessao anterior. De fato, a porcentagem de valores na Figura 5.8 que sao > 8,78, o 
valor observado para o qual encontramos P = 0,018 na sessao da analise parame¬ 
trica, e 46,5. Em outras palavras, a analise bayesiana (Figura 5.8) indica P — 0,67 
de que a densidade de formigueiros nos dois habitats seja verdadeiramente di- 
ferente, dada a estimativa bayesiana de F = 9,77 [P(F > 5,32 | F obs ) = 0,67]. Em 


TABELA 5.7 Estimadores parametrico e bayesiano para as medias e 
desvios-padrao dos dados da Tabela 5.1 


Analise 


Estimadores 


^floresta 

^campo 

^floresta 

^campo 

Parametrica 

7,00 

10,75 

2,19 

1,50 

Bayesiana (priore nao informativa) 

6,97 

10,74 

0,91 

1,13 

Bayesiana (priore informativa) 

7,00 

10,74 

1,01 

1,02 


As estimativas dos desvios-padrao das analises bayesianas sao um pouco menores porque a analise baye¬ 
siana incorpora informa^ao a partir da distribuigao de probabilidades a priori. A analise bayesiana pode 
fornecer resultados diferentes, dependendo da forma da distribuigao a priori e do tamanho amostral. 
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Figura 5.8 Distribui^ao-F hipotetica com um valor esperado de 5,32. Estamos interessados 
em determinar a probabilidade de que F > 5,32 (o valor crftico para P < 0,05 em um teste pa- 
drao da razao-F), conforme os dados sobre densidade de formigueiros daTabela 5.1. Isto e o 
inverso da hipotese nula tradicional, que questiona: qual e a probabilidade de obter os dados, 
dada a hipotese nula? Na analise bayesiana, a probabilidade a posteriori de F > 5,32, de acor- 
do com os dados da Tabela 5.1, e a propor^ao da area sob a curva a direita de F = 5,32, que e 
0,673. Em outras palavras, P(hipotese de que campos e florestas diferem na densidade media 
de formigueiros | dados observados na Tabela 5.1) = 0,673. 0 valor mais provavel a posteriori 
para a razao-F e 9,77. A propor^ao da area sob a curva para a direita desse valor e de 0,413. A 
analise parametrica diz que os dados observados sao improvaveis, dada uma distribui^ao nula 
especificada pela razao-F [P(dados | H 0 )], enquanto a analise bayesiana diz que a probabilidade 
de observar uma razao-F de 9,77 ou maior nao e improvavel em razao dos dados [P(F > 5,32 | 
dados) = 0,673]. 


contraste, a analise parametrica (Figura 5.5) indica P - 0,018 de que a estimativa 
parametrica do F = 8,78 (um de uma razao-F maior) poderia ser encontrada 
dada a hipotese nula de que a densidade de formigueiros nos dois habitats e a 
mesma [P( F obs | H 0 ) = 0,018]. 

Usando a analise bayesiana, uma resposta diferente poderia resultar se tivesse- 
mos usado uma distribui^ao de priores diferente, em vez de priores nao informa- 
tivas de media 0 e variancia muito grande. Por exemplo, se usassemos uma media 
a priori de 15 para as florestas e 7 para campos, uma variancia entre grupos de 
10, e variancia dentro dos grupos de 0,001, entao P(F > 5,32 | dados) = 0,57. Nao 
obstante, voce pode observar que a probabilidade a posteriori depende das priores 
que sao utilizadas na analise (Tabela 5.7). 

Por fim, podemos estimar um intervalo de credibilidade ao redor de nos- 
sa estimativa da razao-F observada. Como no metodo de Monte Carlo, esti- 
mamos o intervalo de credibilidade de 95% conforme os 2,5 e 97,5 percentis 
das razoes-F simuladas. Esses valores sao 0,28 e 28,39. Dessa forma, podemos 
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dizer que estamos 95% certos de que o valor da razao-F observado desse expe- 
rimento esta dentro do intervalo [0,28, 28,39]. Note que a dispersao e grande 
porque a precisao de nossa estimativa da razao-F e baixa, refletida pelo peque- 
no tamanho amostral em nossa analise. Deveriamos comparar o intervalo de 
credibilidade com a interpreta^ao do intervalo de confian^a apresentado no 
Capitulo 3. 

Premissas da analise bayesiana 

Em adi<;ao as premissas padrao de todos os metodos estatisticos (observances 
aleatorias e independentes), a premissa-chave da analise bayesiana e de que os 
parametros a serem estimados sao variaveis aleatorias com distribuinao conhe- 
cida. Em nossa analise, tambem assumimos pouca informaqao a priori (priores 
nao informativas), portanto, a fun<;ao de verossimilhan^a teve mais influencia 
nos calculos finais da distribui<;ao de probabilidades a posteriori do que tive- 
ram as priores. Isso deveria fazer sentido intuitivo. Por outro lado, se tiver- 
mos muita informa^ao a priori, nossa distribui^ao de probabilidades a priori 
(p. ex., a curva preta na Figura 5.6) poderia ter baixa varia^ao e a funqao de 
verossimilhan^a nao mudaria substancialmente a variancia da distribuinao de 
probabilidades a posteriori. Se tivessemos muita informa«;ao a priori, e confi- 
assemos nela, nao aprenderiamos muito com o experimento. Um experimento 
bem-delineado deveria decrescer a estimativa a posteriori da variancia em rela- 
qao a a priori da variancia. 

As contributes relativas das priores e da verossimilhan<;a para a estimativa 
a posteriori da probabilidade da densidade media de formigueiros em florestas e 
ilustrada na Figura 5.9. Nesta Figura, a priore e achatada ao longo da amplitude 
dos dados (i. e., ela e uma priore nao informativa), a verossimilhan^a e a distri- 
buiqao baseada nos dados observados (Tabela 5.1) e a posteriore e o produto 
das duas. Note que a variancia da posteriore e menor que a variancia da veros- 
similhanna porque tinhamos alguma informaqao a priori. Contudo, os valores 
esperados da verossimilhanqa (7,0) e da posteriore (6,97) estao muito proximos, 
pois todos os valores da priore eram igualmente provaveis ao longo da amplitu¬ 
de dos dados. 

Apos fazer esse experimento, temos novas informanoes sobre cada um dos 
parametros que podem ser utilizados em analises de experimentos subsequen- 
tes. Por exemplo, se repetirmos o experimento, poderiamos usar a posteriore 
na Figura 5.9 como nossa priore para a densidade media de formigueiros em 
outras florestas. Para isso, poderiamos usar os valores para \ e <3; da Tabela 5.7 
como as estimativas de \ e Gj ao estabelecer a nova distribuinao de probabili¬ 
dades a priori. 

Vantagens e desvantagens da analise bayesiana 

A analise bayesiana tern um numero de vantagens em rela^ao as abordagens para- 
metricas e de Monte Carlo conduzidas em uma estrutura frequentista. A analise 
bayesiana permite a incorpora^ao explicita de informa^ao a priori, e os resulta- 
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Figura 5.9 Densidade de probabilidades da priore, da verossimilhan^a e da posteriore para o 
numero medio de formigueiros das parcelas de florestas. Na analise bayesiana dos dados da Tabela 
5.1, usamos uma distribute) a pr/on que e nao informativa, com media 0 e variancia de 100.000. 
Essa distribui^ao normal gerou uma amplitude de valores de probabilidade das priores essencial- 
mente uniformes (preta) ao longo da amplitude de valores para a densidade de formigueiros 
em florestas. A verossimilhan^a (verde) representa a probabilidade com base nos dados observados 
(Tabela 5.1), e a probabilidade a posteriori (cinza) e o produto das duas. Note que a distributed 
a posteriori e mais precisa que a verossimilhan^a, porque ela leva em considered a (modesta) 
informa^ao contida nas priores. 


dos de um experimento (a posteriori ) podem ser usados para informar (como 
priores) experimentos subsequentes. Os resultados de uma analise bayesiana sao 
interpretados de maneira intuitivamente simples e as inferences obtidas sao con- 
dicionadas aos dados observados e a informa^ao a priori. 

As desvantagens da analise bayesiana sao seus desafios computacionais (mes- 
mo os programas disponiveis atualmente sao dificeis de usar) e o requerimento 
de condicionar as hipoteses aos dados [i. e., P(hipotese | dados)]. A desvantagem 
mais seria da analise bayesiana e a potencial falta de objetividade, pois diferentes 
resultados serao obtidos usando-se diferentes priores. Como consequencia, dife¬ 
rentes pesquisadores podem obter resultados diferentes a partir do mesmo con- 
junto de dados, caso eles comecem com diferentes preconceitos ou informa^oes 
a priori. O uso de priores nao informativas objetiva solucionar essas criticas, mas 
aumenta a complexidade computacional. 


RESUM0 

As tres maiores estruturas de analises estatisticas sao Monte Carlo, parametrica e 
bayesiana. Todas elas assumem que os dados foram amostrados aleatoria e inde- 
pendentemente. Na analise de Monte Carlo, os dados sao aleatorizados ou rear- 
ranjados, de forma que os individuos sao reatribuidos aos grupos. As estatisticas 
de teste sao calculadas para os conjuntos de dados aleatorizados e o rearranjo e 
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repetido muitas vezes para gerar uma distribui<;ao de valores simulados. A pro- 
babilidade em cauda da estatistica de teste e, entao, estimada a partir dessa distri- 
bui^ao. As vantagens da analise de Monte Carlo sao: nao faz nenhuma premissa 
acerca da distribui^ao dos dados, torna a hipotese nula clara e explicita, e pode ser 
relacionada a conjuntos de dados e hipoteses individuals. A desvantagem e que ela 
nao e uma solu<;ao geral e muitas vezes requer uma programa^ao de computador 
para ser implementada. 

Na analise parametrica, os dados sao assumidos como tendo sido tirados de 
uma distribui^ao subjacente conhecida. Uma estatistica-teste observada e compa- 
rada a distribui^ao teorica com base na hipotese nula de varia^ao aleatoria. A van- 
tagem da analise parametrica e que ela fornece uma estrutura unificadora para os 
testes estatisticos de hipoteses nulas classicas. A analise parametrica tambem e fa¬ 
miliar a maioria dos ecologos e cientistas do ambiente e e amplamente implemen¬ 
tada em softwares estatisticos. Sua desvantagem e que os testes nao especificam a 
probabilidade da hipotese alternativa, que, com frequencia, tern maior interesse 
que a hipotese nula. 

A analise bayesiana considera os parametros como sendo variaveis aleatorias 
se considerados os valores fixos. Ela pode tomar vantagem explicita de informa- 
0es a priori, apesar dos metodos bayesianos modernos apoiarem-se em priores 
nao informativas. Os resultados das analises bayesianas sao expressos como dis- 
tribui^o de probabilidades, e suas interpreta^oes conformam a nossa intu^ao. 
Contudo, a analise bayesiana requer computa^ao complexa e frequentemente re¬ 
quer que o pesquisador escreva seu proprio programa. 



Parte II 


DEUNEAMENTO DE 
EXPERIMENTOS 






< 


> 


6 

Delineando Estudos 
de Campo com Sucesso 


A analise de dados adequada esta relacionada com o delineamento amos- 
tral e o esbo^o experimental adequados. Se existem erros ou problemas 
s^rios no delineamento do estudo ou na coleta de dados, raras vezes £ possivel 
repar^-los apos o erro. Em contraste, se o estudo e devidamente delineado e exe- 
cutado, os dados com frequencia podem ser analisados de vdrias formas, a fim 
de responder diferentes questoes. Neste capitulo discutimos uma vasta gama de 
assuntos que voce precisa considerar ao delinear um estudo em ecologia. Nao 
precisamos superestimar a importancia de pensar sobre esses assuntos antes de 
come^ar a coletar dados. 

QUAL E A QUESTAO CENTRAL DO ESTUDO? 

Apesar de parecer jocoso e a resposta obvia, muitos estudos sao iniciados sem 
uma resposta clara para esta questao. A maioria das respostas iri tomar a forma 
de questoes mais especificas. 

Existem diferen^as espaciais ou temporais na variavel K? 

Em geral esta questao £ respondida com a coleta de dados e ela representa o ponto 
de partida de muitos estudos ecologicos. Os m^todos estatisticos padrao, como 
a analise de variancia (ANOVA) e a regressao, sao bem adequados para respon¬ 
der esta questao. Alem disso, o teste e a rejei^ao convencional de uma hipbtese 
nula simples (ver Capitulo 4) produzem uma resposta dicotbmica de sim ou nao 
para essa pergunta. E dificil ate mesmo discutir os mecanismos sem ter nenhuma 
no^ao dos padroes espaciais e temporais em seus dados. Entender as formas que 
controlam a diversidade biologica, por exemplo, requer, no minimo, um mapa 
espacial da riqueza de esp^cies. O delineamento e a implementa^'ao de uma amos- 
tragem em ecologia com sucesso requer grande esfonpo e cuidado, o que tambem 
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e necessario para um estudo experimental com sucesso. Em alguns casos, um es- 
tudo amostral ira endere«;ar todos os seus objetivos de pesquisa; em outros, um 
estudo amostral sera o primeiro passo em um projeto de pesquisa. Uma vez que 
tenha documentado os padroes espaciais e temporais em seus dados, voce condu- 
zira experimentos ou coletas adicionais para acessar os mecanismos responsaveis 
por aqueles padroes. 

Qual e o efeito do fator X sobre a variavel K? 

Esta e a questao diretamente respondida por um experimento manipulative. Em 
um experimento de campo ou de laboratorio, o pesquisador estabelece ativamen- 
te diferentes niveis do fator X e mede a resposta da variavel Y. Se o delineamento 
experimental e as analises estatisticas sao apropriados, o valor de P resultante 
pode ser utilizado para testar a hipotese nula de nenhum efeito do fator X. Resul- 
tados estatisticamente significativos sugerem que o fator X influencia a variavel Y, 
e que o “sinal” do fator X e forte o suficiente para ser detectado acima do “ruido” 
causado por outras fontes de varia<;ao natural. 1 Certos experimentos naturais po- 
dem ser analisados da mesma forma, tirando vantagem da varia^o natural que 
existe no fator X. Contudo, as inferencias resultantes geralmente sao fracas, pois 
ha menos controle sobre variaveis confundidas. Discutiremos experimentos na¬ 
turais com mais detalhe adiante, neste capitulo. 

As medidas da variavel Ksao consistentes com as 
precludes da hipotese H? 

Esta pergunta representa o classico confronto entre teoria e dados (Hilborn & 
Mangel, 1997). No Capitulo 4, discutimos duas estrategias usadas neste con¬ 
fronto: a abordagem indutiva, na qual uma unica hipotese e recursivamente 
modificada para se adaptar aos dados que se acumulam; e a abordagem hipo- 
tetico-dedutiva, na qual as hipoteses sao falseadas e descartadas caso nao pre¬ 
digam os dados. Dados de estudos experimentais ou observacionais podem ser 
utilizados para questionar se as observances sao consistentes com as predi^oes 
de uma hipotese mecanistica. Infelizmente, os ecologos nem sempre postu- 
lam essa questao tao claramente. Suas duas limitanoes sao: (1) muitas hipoteses 
ecologicas nao geram predinoes simples e falseaveis e (2) mesmo quando uma 
hipotese gera predi<;oes, raras vezes sao unicas. Dessa forma, pode nao ser pos- 
sivel testar definitivamente a Hipotese H usando apenas dados coletados sobre 
a variavel Y. 


1 Embora os experimentos manipulativos permitam inferencias fortes, eles podem nao revelar 
mecanismos explicitos. Muitos experimentos na ecologia sao simplesmente uma especie de “cai- 
xa preta”, que medem a resposta da variavel Y a mudan^as no fator X , mas nao elucidam meca¬ 
nismos em niveis inferiores que causam aquela resposta. Tal entendimento mecanistico pode 
exigir observa^oes ou experimentos adicionais, objetivando uma questao mais especifica acerca 
do processo. 
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Usando as medidas da variavel Y, qual e a melhor estimativa 
do parametro 6 no modelo Z? 

Modelos estatisticos e matematicos sao ferramentas poderosas em ecologia e em 
ciencias ambientais. Eles permitem a previsao de como as populates e as comu- 
nidades vao mudar ao longo do tempo ou responder a cond^oes ambientais alte- 
radas (p. ex., Sjogren-Gulve & Ebenhard, 2000). Os modelos tambem podem nos 
ajudar a entender como diferentes mecanismos ecologicos interagem de manei- 
ra simultanea para controlar a estrutura de comunidades e populates (Caswell, 
1988). A estimativa de parametros e necessaria para construir modelos preditivos 
e e uma caracteristica especialmente importante das analises bayesianas (ver Ca- 
pitulo 5). Raras vezes ha uma correspondence simples, de um pra um, entre o 
valor da variavel Y, medida em campo, e o valor do parametro 0 em nosso mode¬ 
lo. Em vez disso, esses parametros devem ser extraidos e estimados indiretamente 
a partir de nossos dados. Infelizmente, alguns dos mais comuns e tradicionais 
delineamentos utilizados em experimentos em ecologia e amostragens de campo, 
como a analise de variancia (ver Capitulo 10), nao sao muito uteis para estimar 
parametros de modelos. No Capitulo 7, discutiremos alguns delineamentos alter¬ 
natives mais uteis na estimativa de parametros. 

EXPERIMENTOS MANIPULATES 

Em um experimento manipulative, o pesquisador primeiro altera os niveis da 
variavel preditora (ou o fator) e entao mede como uma ou mais variaveis de inte- 
resse respondem a essas altera<;6es. Tais resultados sao entao utilizados para tes- 
tar hipoteses de causa e efeito. Por exemplo, se estamos interessados em testar 
a hipotese de que a preda<;ao por lagartos controla a densidade de aranhas em 
pequenas ilhas do Caribe, podemos alterar a densidade de lagartos em uma serie 
de cercados e medir a densidade de aranhas resultante (p. ex., Spiller 8c Schoener, 
1998). Poderiamos, entao, representar graficamente estes dados, de maneira que 
o eixo-x (= variavel independente) e a densidade de lagartos e o eixo-y (= variavel 
dependente), a densidade de aranhas (Figura 6.1A,B). 

Nossa hipotese nula e de que nao ha rela^ao entre essas duas variaveis (Fi¬ 
gura 6.1A). Isto e, a densidade de aranhas pode ser alta ou baixa em um cer- 
cado particular, mas nao e relacionada com a de lagartos, que foi colocada no 
cercado. Alem disso, podemos observar uma rela^ao negativa entre a densidade 
de aranhas e de lagartos: cercados com as maiores densidades de lagartos tern 
menos aranhas e vice-versa (Figura 6.IB). Logo, esse padrao pode ser sujeito 
a uma analise estatistica, como a regressao (Capitulo 9), para determinar, ou 
nao, se a evidencia foi suficiente para rejeitar a hipotese nula de que nao ha 
rela<;ao entre as densidades de lagartos e de aranhas. A partir desses dados tam¬ 
bem podemos estimar os parametros do modelo de regressao que quantificam 
a for^a da rela^ao. 
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Figura 6.1 Rela^ao entre a densidade de lagartos e a de aranhas em urn experimento de 
campo natural e manipulative. Cada ponto representa uma parcela ou urn cercado em que 
ambas, densidade de aranhas e de lagartos, foram medidas. (A) A hipotese nula e de que a 
densidade de lagartos nao tern efeito sobre a de aranhas. (B) A hipotese alternativa e de que a 
preda^ao por lagartos controla a densidade de aranhas, levando a uma rela^ao negativa entre 
essas duas variaveis. 


Apesar de os experimentos de campo serem populares e poderosos, eles pos- 
suem varias limita<;des importantes. Primeiro, e desafiador conduzir experimen¬ 
tos em grandes escalas espaciais; mais de 80% dos experimentos de campo foram 
conduzidos em parcelas com menos de 1 m 2 (Kareiva & Anderson, 1988; Wiens, 
1989). Quando experimentos sao conduzidos em grandes escalas espaciais, a re- 
plica^ao e inevitavelmente sacrificada (Carpenter, 1989). Mesmo quando replica- 
do adequadamente, experimentos conduzidos em pequenas escalas espaciais po- 
dem nao produzir resultados que sejam representatives dos padroes e processos 
que ocorrem em escalas espaciais maiores (Englund & Cooper, 2003). 

Segundo, experimentos de campo frequentemente sao restritos a organismos 
de corpo pequeno e de vida curta, mais faceis de manipular. Apesar da tenden- 
cia que temos em generalizar os resultados de nossos experimentos para outros 
sistemas, e improvavel que a intera^o entre lagartos e aranhas nos diga muito 
sobre a intera^ao entre leoes e gnus. Terceiro, e dificil mudar uma, e apenas uma, 
variavel por vez em experimentos manipulativos. Por exemplo, gaiolas podem ex- 
cluir outros tipos de predadores e presas, alem de aumentar o sombreamento. Se 
compararmos cuidadosamente a densidade de aranhas em gaiolas fechadas versus 
gaiolas abertas “controle”, os efeitos da preda^ao por lagartos sao confundidos 
com outras diferen^as fisicas entre os tratamentos. Mais adiante, neste capitulo, 
discutiremos solu^oes para variaveis confundidas. 

Por ultimo, muitos delineamentos experimentais padrao sao simplesmente 
desajeitados para experimentos de campo realisticos. Por exemplo, suponha 
que estamos interessados em investigar intera^oes competitivas em um gru- 
po de oito especies de aranhas. Cada tratamento em tal experimento poderia 
consistir em uma combina^ao unica de especies. Embora o numero de especies 
em cada tratamento varie de 1 a 8, o de combina«;6es unicas e 2 8 - 1 = 255. Se 
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quisermos estabelecer 10 replicas de cada tratamento (ver“A Regra dos 10”, dis- 
cutida posteriormente neste capitulo), necessitariamos de 2.550 parcelas. Isto 
pode nao ser possivel por causa de restri^ao de espa^o, tempo ou mao-de-obra. 
Por causa de todas essas limita^oes em potencial, muitas questoes importantes 
em ecologia de comunidades nao podem ser endere^adas com experimentos 
de campo. 

EXPERIMENTOS NATURAIS 

Um experimento natural (Cody, 1974) realmente nao e um experimento com- 
pleto. Pelo contrario, e um estudo observacional no qual tiramos vantagem da 
varia<;ao natural presente na variavel de interesse. Por exemplo, em vez de dire- 
tamente manipular a densidade de lagartos (uma empreitada cara, dificil e de- 
morada), poderiamos fazer o censo em um conjunto de parcelas (ou ilhas) que 
variam naturalmente na densidade de lagartos (Schoener, 1991). Idealmente, es¬ 
sas parcelas devem variar apenas na densidade de lagartos e serem identicas em 
todos os outros aspectos. Poderiamos, entao, analisar a rela^ao entre a densidade 
de aranhas e a de lagartos, como ilustrado na Figura 6.1. 

Experimentos naturais e experimentos manipulativos em geral resultam nos 
mesmos tipos de dados e sao analisados com os mesmos tipos de estatisticas. Po- 
rem, com frequencia existem diferen«;as importantes na interpreta<;ao de experi¬ 
mentos naturais e manipulativos. Em um experimento manipulative, se tivermos 
estabelecido controles validos e mantido as mesmas condi^oes ambientais entre 
as replicas, qualquer diferen^a consistente na variavel resposta (p. ex., densidade 
de aranhas) pode ser atribuida, com confian<;a, as diferen^as no fator manipulado 
(p. ex., densidade de lagartos). 

Nao temos a mesma confian^a ao interpretar resultados de experimentos na¬ 
turais. Nesse caso, nao sabemos a dire^ao da causa e efeito, e nao controlamos ou- 
tras variaveis que certamente variam entre as replicas. Para o exemplo dos lagartos 
e aranhas, ha pelo menos quatro hipoteses capazes de explicar uma associa^ao 
negativa entre a densidade de lagartos e aranhas: 

1. Lagartos podem controlar a densidade de aranhas. Eis a hipotese alternativa 
de interesse do experimento de campo original. 

2. Aranhas podem, direta ou indiretamente, controlar a densidade de lagar¬ 
tos. Suponha, por exemplo, que grandes aranhas ca«;adoras consomem pe- 
quenos lagartos, ou que aranhas tambem sejam predadas por passaros que 
igualmente se alimentam de lagartos. Em ambos os casos, o aumento na 
densidade de aranhas pode decrescer a de lagartos; mesmo que estes comam 
aranhas. 

3. Ambas, densidades de aranhas e de lagartos, sao controladas por um fator 
ambiental nao medido. Por exemplo, suponha que a densidade de aranhas e 
maior em parcelas umidas e a densidade de lagartos, em parcelas secas. Mes¬ 
mo que os lagartos tenham pouco efeito sobre as aranhas, o padrao mostrado 
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na Figura 6.IB ira aparecer: parcelas umidas terao muitas aranhas e poucos 
lagartos; e parcelas secas, o contrario. 

4. Fatores ambientais podem controlar a for<;a da intera^ao entre aranhas e la¬ 
gartos. Por exemplo, eles podem ser eficientes predadores de aranhas em par¬ 
celas secas, mas ineficientes em parcelas umidas. Em tais casos, a densidade 
de aranhas dependera tanto da de lagartos quanto do nivel de umidade da 
parcela (Spiller & Schoener, 1995). 

Esses quatro cenarios sao apenas os mais simples que podem levar a uma 
rela^ao negativa entre a densidade de lagartos e a de aranhas (Figura 6.2). Se adi- 
cionarmos setas de duas pontas ao diagrama (aranhas e lagartos afetam recipro- 
camente a densidade um do outro), ha uma gama ainda maior de hipoteses que 
podem explicar a rela^ao observada entre a densidade de lagartos e a de aranhas 
(Figura 6.1). 

Entretanto, tudo isso nao quer dizer que nao ha esperan^a para experimentos 
naturais: em muitos casos podemos coletar dados adicionais para distinguir entre 
essas hipoteses. Por exemplo, se suspeitarmos que as variaveis ambientais, como 
a umidade, sao importantes, podemos tanto restringir a amostragem a um con- 
junto de parcelas com niveis de umidade comparaveis, ou (melhor ainda) medir 
a densidade de lagartos, a de aranhas e os niveis de umidade em uma serie de par¬ 
celas ao longo de um gradiente de umidade. Variaveis confundidas e mecanismos 
alternativos tambem podem ser problematicos em experimentos de campo. Con- 
tudo, seus impactos serao minimizados se o investigador conduzir experimentos 
em escalas espaciais e temporais adequadas, estabelecer controles apropriados, 




Figura 6.2 Hipoteses mecam'sticas para explicar as correlates entre a densidade de lagartos e 
a de aranhas (Figura 6.1). A rela^ao de causa e efeito pode ser a partir do predador para a presa (es- 
querda superior) ou da presa para o predador (direita superior). Modelos mais complicados incluem 
os efeitos de outras variaveis bioticas ou abioticas. Por exemplo, pode nao haver interact) entre 
lagartos e aranhas, mas a densidade de ambos pode ser controlada por uma terceira variavel, como 
a umidade (esquerda inferior). Alternativamente, a umidade pode ter um efeito indireto, alterando 
a interagao de lagartos e aranhas (direita Inferior). 



























Prindpios de Estati'stica em Ecologia 161 


replicar adequadamente e usar a randomiza^ao para estabelecer a posi<;ao das re¬ 
plicas e para atribuir os tratamentos. 

Definitivamente, experimentos manipulativos permitem maior confian^a em 
nossas inferences sobre causa e efeito, mas sao limitados a escalas espaciais rela- 
tivamente pequenas e curtas estruturas de tempo. Experimentos naturais podem 
ser conduzidos em, virtualmente, qualquer escala espacial (de pequenas parcelas 
a continentes inteiros) e ao longo de qualquer intervalo de tempo (de medidas de 
campo semanais, a censos anuais ate estratos fosseis). Contudo, e mais desafiador 
distinguir entre relates de causa e efeito em experimentos naturais. 2 

EXPERIMENTOS FOTOGRAFICOS VERSUS EXPERIMENTOS DE TRAJETORIA 

As duas variantes de experimentos naturais sao: os experimentos fotograficos e 
os de trajetoria (Diamond, 1986). Os primeiros sao replicados no espa^o e os de 
trajetoria, no tempo. Para os dados da Figura 6.1, suponha que fizemos o censo 
em 10 parcelas diferentes em um unico dia. Este e um experimento fotografico 
no qual a replica^ao e espacial; cada observa^ao representa uma parcela diferente 
em que o censo foi feito ao mesmo tempo. Por outro lado, suponha que visitamos 
uma mesma parcela em 10 anos diferentes. Trata-se de um experimento de tra¬ 
jetoria cuja replica^ao e temporal; cada observa^ao representa um ano diferente 
no estudo. 

As vantagens de um experimento fotografico e que ele e rapido, e as replicas 
espaciais sao estatisticamente mais independentes umas das outras do que as re¬ 
plicas temporais de um experimento de trajetoria. A maioria dos conjuntos de 
dados ecologicos e de experimentos fotograficos, refletindo a estrutura de 3 a 5 
anos oferecida pela maioria dos financiamentos de pesquisa e teses de doutorado. 3 
De fato, muitos estudos de mudan^a temporal sao, na realidade, experimentos 
fotograficos, pois a varia^ao no espa^o e tratada como variavel substituta para 


2 Em alguns casos, a distin^ao entre experimentos manipulativos e experimentos naturais de campo 
nao e trivial. A atividade humana tern gerado muitos experimentos nao intencionais em larga escala, 
incluindo eutrofiza^ao, altera^ao de habitats, mudan^a climatica global e introdu^ao ou remo^ao de 
especies. Ecologos criativos podem tirar vantagem dessas altera^oes para delinear estudos em que a 
confian^a nas conclusoes e muito alta. Por exemplo, Knapp et al. (2001) estudaram os impactos da 
introdu^ao de trutas em lagos na Serra Nevada, comparando comunidades de invertebrados em lagos 
naturalmente sem peixes, lagos com peixes e lagos que ja tiveram peixes. Muitas compara^oes desse 
tipo sao possiveis para documentar as consequencias da atividade humana. Contudo, conforme os 
impactos humanos se tornam mais disseminados e perceptiveis, pode ser cada vez mais dificil encon- 
trar locais que possam ser considerados controles sem manipula^ao. 

3 Uma exce^ao notavel a experimentos ecologicos de curta dura^ao e o conjunto de estudos coorde- 
nados desenvolvidos nas areas de Pesquisa Ecologica de Longa Dura^ao (PELD). A National Science 
Foundation - NSF (Estados Unidos) financiou o estabelecimento desses locais ao longo dos anos 
1980 e 90, especificamente para visar as necessidades de estudos de pesquisas ecologicas que alcan- 
cem de decadas a seculos. Ver http://www.Iternet.edu/. 
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a varia^ao no tempo. Por exemplo, a mudan^a de sucessao em comunidades de 
plantas pode ser estudada amostrando uma cronossequencia - um conjunto de 
observances, locais ou habitats ao longo de um gradiente espacial que difere no 
tempo de origem (p. ex., Law et al., 2003). 

A vantagem de um experimento de trajetoria e que ele revela como os sis- 
temas ecologicos mudam ao longo do tempo. Muitos modelos ecologicos e am- 
bientais descrevem precisamente o tipo de mudan^a, e esse tipo de experimento 
permite compara^oes mais fortes entre as pred^oes do modelo e os dados de 
campo. Alem disso, muitos modelos para conserva^ao ou de previsao ambiental 
sao elaborados para se prever conduces futuras, e dados para esses modelos sao 
derivados com mais confianna de experimentos de trajetoria. Muitos dos conjun- 
tos de dados mais valiosos da ecologia sao de longas series temporais, nos quais 
populates e comunidades em um local sao amostradas ano apos ano com me- 
todos consistentes e padronizados. Contudo, esses experimentos que sao restritos 
a um unico local nao sao replicados no espa^o. Nao sabemos se as trajetorias 
temporais descritas para aquele local sao tipicas para o que podemos encontrar 
em outros lugares. Cada trajetoria e essencialmente de tamanho amostral um em 
um dado local. 4 

0 problema da dependence temporal 

Um problema mais dificil com os experimentos de trajetoria e a potencial nao 
independence dos dados coletados em uma sequencia temporal. Por exemplo, 
suponha que voce me<;a o diametro de arvores todo mes por um ano em uma 
parcela de sequoias. Sequoias crescem muito devagar, logo as medidas de um 
mes para outro serao identicas. Muitos engenheiros florestais diriam que voce 
nao tern 12 amostras independentes, voce tern apenas uma (o diametro me¬ 
dio para aquele ano). Por outro lado, medidas mensais de uma comunidade 
planctonica de agua doce e de rapido desenvolvimento podem ser vistas como 
estatisticamente independentes uma da outra. Naturalmente, quanto mais afas- 
tadas no tempo uma amostra for de outra, mais elas funcionarao como replicas 
independentes. 

Mesmo se o intervalo correto entre os censos for empregado, ainda ha um 
subito problema em como a mudan^a temporal deve ser modelada. Por exemplo, 
suponha que voce esta tentando modelar a mudan^a no tamanho populacional 
de uma planta anual de deserto, para o qual voce tern acesso a um bom estudo de 


4 Tanto os delineamentos instantaneos quanto os de trajetoria sao vistos em experimentos manipula- 
tivos. Em particular, alguns delineamentos incluem uma serie de medidas realizadas antes e depois de 
uma manipula^ao. As medidas “previas” servem como um tipo de “controle”, que pode ser compara- 
do as realizadas apos a manipula^ao ou interven^ao. Esse tipo de delineamento ADCI (Antes-Depois; 
Controle-lmpacto) e especialmente importante em analises de impacto ambiental e em estudos onde 
a replica^ao espacial e limitada. Para mais informa^oes sobre ADCI, ver a se^ao “Estudos em Larga 
Escala e Impactos Ambientais” mais adiante, neste Capitulo, e no Capitulo 7. 




Prindpios de Estati'stica em Ecologia 163 


trajetoria, com 100 anos de censos anuais consecutivos. Voce poderia ajustar um 
modelo de regressao linear padrao ( ver Capitulo 9) para a serie temporal. 

ty=P o + Pi f + e (6.1) 

Nesta equaqao, o tamanho populacional (N t ) e uma fun^ao linear da quanti- 
dade de tempo (f) que passou. Os coeficientes (3 0 e (3, sao o intercepto e a inclina- 
^ao dessa linha reta. Se P, e menor que 0,0, a popula^ao esta encolhendo com o 
tempo; se (3, > 0, N esta aumentando. Aqui, £ e o termo do erro com distribui<;ao 
normal chamado de ruido branco 5 , que incorpora tanto o erro nas medidas e a 
varia^ao aleatoria no tamanho da popula^ao. O Capitulo 9 explicara esse modelo 
em muito mais detalhes, mas o apresentamos agora como uma forma simples de 
pensar acerca de como o tamanho populacional pode mudar de forma linear com 
o passar do tempo. 

Contudo, esse modelo nao leva em considera^ao que o tamanho populacional 
muda atraves de nascimentos e mortes, afetando o tamanho populacional atual. 
Um modelo de serie temporal pode descrever o crescimento populacional como 

ty+1 = P 0 + Pity + £ (6.2) 

Neste modelo, o tamanho da popula^ao no proximo passo de tempo (N I+1 ) 
nao depende simplesmente da quantidade de tempo t que passou, mas sim do 
tamanho populacional no ultimo passo de tempo ( N t ). Nesse modelo, a constan- 
te P, e um termo multiplicador que determina se a popula^ao esta aumentando 
exponencialmente (Pj > 1,0) ou diminuindo (P, <1,0). Como antes, £ e um termo 
de erro de ruido branco. 

O modelo linear (Equa^ao 6.1) descreve um simples aumento aditivo do N 
com o tempo, enquanto a serie temporal, ou modelo autoregressivo (Equa<;ao 
6.2), descreve um aumento exponencial, pois o fator Pj e um multiplicador que, 
em media, da uma porcentagem constante de aumento no tamanho populacional 
a cada passo no tempo. A diferen^a mais importante entre os dois modelos, con- 


" Ruido branco e um tipo de distribui^ao de erro na qual os erros sao independentes e nao corre- 
lacionados uns com os outros. Ele e chamado de ruido branco como analogia a luz branca, que 
e uma mistura igual de comprimentos de onda longos e curtos. Em contraste, a distribui^ao de 
ruido vermelho e dominada por perturba<;6es de baixa frequencia, assim como a luz vermelha 
e dominada por ondas de luz de baixa frequencia. A maioria das series temporais, se avaliado o 
tamanho de populacional, exibe um ruido de espectro avermelhado (Pimm & Redfearn, 1988), 
de forma que as variancias no tamanho populacional aumentam quando elas sao analisadas em 
escalas temporais maiores. Modelos de regressao parametrica requerem termos de erro com dis- 
tribui^ao normal, de forma que as distributes de ruido branco formam as bases para a maioria 
dos modelos ecologicos estocasticos. Contudo, um espectro inteiro de distributes de ruido co- 
loridos (ruido 1/f) podem fornecer um ajuste melhor a muitos conjuntos de dados de ecologia e 
evolu^ao (Halley, 1996). 
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tudo, e que as diferen^as entre o tamanho populacional observado e o predito (i. 
e., os desvios) no modelo de serie temporal sao correlacionados uns com os ou- 
tros. Como consequencia, ha uma tendencia em haver periodos de aumento con- 
secutivos seguidos por periodos de diminui^oes consecutivas. Isto ocorre porque 
a trajetoria de crescimento tern uma “memoria” - cada observa^ao consecutiva 
(N t+l ) depende intimamente da que veio antes (o termo N t na Equa^ao 6.2). Em 
contraste, o modelo linear nao tern memoria, e os aumentos sao fun^ao apenas 
do tempo (e do e) e nao de N r Portanto, os desvios positivos e negativos seguem 
um ao outro em uma tendencia puramente aleatoria (Figura 6.3). Desvios corre¬ 
lacionados, que sao tipicos em dados coletados em estudos de trajetoria, violam 
as premissas da maioria das analises estatfsticas mais convencionais. 6 Novos me- 
todos analiticos e computacionalmente intensivos tern sido desenvolvidos para 
analisar tanto dados amostrais quanto dados experimentais coletados atraves do 
tempo (Ives et al., 2003; Turchin, 2003). 

Isso nao quer dizer que nao podemos incorporar dados de series temporais 
em analises estatisticas convencionais. Nos Capitulos 7 e 10, discutiremos formas 
adicionais para analisar dados de series temporais. Esses metodos demandam que 
voce tenha uma aten^ao cuidadosa tanto no delineamento amostral quanto no 
tratamento dos dados apos a coleta. Sobre isso, dados de series temporais ou de 
trajetoria sao iguais a qualquer outro tipo de dado. 

EXPERIMENTS DE PRESSAO VERSUS EXPERIMENTS DE PULS0S 

Em experimentos manipulativos, tambem distinguimos entre experimentos 
de pressao e experimentos de pulsos (Bender et al., 1984). No primeiro caso, 
as condi<;6es alteradas no tratamento sao mantidas ao longo do tempo e sao 
reaplicadas conforme a necessidade, para assegurar que a for^a da manipu- 
la^ao permane^a constante. Assim, o fertilizante talvez deva ser reaplicado as 
plantas, e animais que morreram ou desapareceram de uma parcela podem ter 
de ser repostos. Ao contrario, em um experimento de pulsos, os tratamentos 
experimentais sao aplicados apenas uma vez, no comedo do estudo. O trata¬ 
mento nao e reaplicado e a replica e permitida que se recupere da manipula<;ao 
(Figura 6.4A). 

Os experimentos de pressao e de pulso medem duas respostas diferentes ao 
tratamento. O de pressao (Figura 6.4B) mede a resistencia do sistema ao trata- 


6 Na verdade, a autocorrela^ao espacial gera os mesmos problemas (Legendre & Legendre, 1998; Li- 
chstein et al., 2003). Contudo, ferramentas para a analise de autocorrela^ao espacial tern sido desen- 
volvidas mais ou menos independentemente das analises de series temporais, talvez porque percebe- 
mos o tempo como uma variavel estritamente unidimensional e o espa^o como uma variavel bi ou 
tridimensional. 
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Figura 6.3 Exemplos de series temporais deterministicas e estocasticas, com e sem autocorrela- 
$ao. Cada popula^ao come^a com 100 individuos. Urn modelo linear sem erro (linha tracejada) ilus- 
tra uma tendencia de crescimento constante na popula^ao. Um modelo linear com termo de erro 
de ruido branco estocastico (linha preta) adiciona variabilidade temporal nao correlacionada. Por 
ultimo, um modelo autocorrelacionado (linha verde) descreve o tamanho da popula^ao no proxi¬ 
mo passo de tempo (f+1), comofungao do tamanho populacional no tempo atual (r), acrescido de 
ruido aleatorio. Apesar de o termo de erro nesse modelo ainda ser uma simples variavel aleatoria, 
a serie temporal resultante apresenta autocorrelagao - existem periodos de crescimento popula¬ 
cional seguidos de declinio da popula^ao. Para o modelo linear e para o modelo de ruido branco 
estocastico, a equa^ao eN t -a + bt+e, onde a = 100 e b = 0,10. Para o modelo autocorrelacionado, 
N t+] = a +bN, + e, onde a = 0,0 e b = 1,0015. Para ambos os modelos com erro, e e uma variavel 
aleatoria normal: e ~ N(0,1). 


mento experimental: a extensao a qual ele resiste mudar ao ambiente constante 
criado pelo experimento de pressao. Um sistema com baixa resistencia ira exibir 
uma grande resposta a um experimento de pressao; enquanto isso, um sistema 
com alta resistencia ira exibir pouca diferen<;a entre os tratamentos de controle e 
manipulados. 

Experimentos de pulso medem a resiliencia do sistema ao tratamento expe¬ 
rimental: a extensao a qual o sistema se recupera de uma unica perturba^ao. Um 
sistema com alta resiliencia ira apresentar um rapido retorno as condi<;6es de con¬ 
trole, enquanto um com baixa resiliencia levara um longo tempo para se recupe- 
rar; parcelas manipuladas e de controle irao continuar diferindo por um longo 
tempo apos uma unica aplica^ao do tratamento. 

A distin<;ao entre experimentos de pressao e de pulso nao e o numero de aplica- 
<;oes dos tratamentos utilizados, mas se as condi^oes alteradas sao mantidas ao lon¬ 
go do tempo no tratamento. Se as condi^oes ambientais permanecem constantes 
apos uma unica perturba^ao durante o experimento, o delineamento e efetivamen- 
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(A) Experimento de pulso 



(B) Experimento de pressao 



Tempo 


Figura 6.4 Experimentos ecologicos de pulso e pressao. As setas indicam a aplica^ao do trata- 
mento, e a linha indica a trajetoria temporal da variavel resposta. 0 experimento de pulso (A) mede 
a resposta a uma unica aplicagao do tratamento (resiliencia), enquanto o experimento de pressao 
(B) mede a resposta sob concludes constantes (resistencia). 


te um experimento de pressao. Outra distin^ao entre experimentos de pressao e de 
pulso e que o primeiro mede a resposta do sistema sob condi^oes de equilibrio, en¬ 
quanto o segundo registra respostas transitorias em um ambiente em modifica^ao. 

REPLICA^AO 
Quantas replicas? 

Eis uma das questoes mais comuns que ecologos e cientistas da area ambiental 
perguntam aos estatisticos. A resposta correta e que depende da variancia nos 
dados e do tamanho do efeito - a diferen^a que voce deseja detectar entre as me- 
dias dos grupos em compara^ao. Infelizmente, essas duas quantidades sao dificeis 
de estimar, embora voce sempre deva considerar que o tamanho do efeito seria 
razoavel observar. 

Para estimar variancias, muitos estatisticos irao recomendar que voce con- 
duza um estudo-piloto. Infelizmente, estudos-piloto geralmente sao inviaveis - e 
voce raras vezes tera a liberdade de montar e executar um estudo caro e demorado 
mais de uma vez. Os periodos de campo e as propostas de financiamento sao 
muito curtos para esse tipo de luxuria. Contudo, voce deve ser apto a estimar uma 
amplitude razoavel para as variancias e para o tamanho dos efeitos a partir de es- 
tudos publicados previamente e a partir da discussao com colegas. Voce pode usar 
esses valores para determinar o poder estatistico (ver Capitulo 4) que ira resultar 
de diferentes combina^oes de replicas, variancias e tamanhos do efeito (ver Figura 
4.5, para um exemplo). No minimo, contudo, voce precisa primeiro responder a 
seguinte questao: 

Quantas replicas sao possiveis no total? 

Leva tempo, trabalho fisico e dinheiro para coletar tanto dados experimentais 
quanto expedites, e voce precisa determinar precisamente o total de amostras 














Prindpios de Estati'stica em Ecologia 167 


que pode custear. Se voce esta conduzindo uma cultura ou analise amostral 
cara, o custo em reais pode ser o fator limitante. Contudo, em muitos estudos, 
tempo e trabalho fisico sao mais limitantes que o dinheiro. Isto e especialmente 
verdade para expedites geograficas conduzidas em grandes escalas espaciais, 
para as quais voce (e sua equipe de campo, se tiver sorte o bastante para ter 
uma) pode gastar tanto tempo viajando para os locais de estudo quanto co- 
letando os dados de campo. Idealmente, todas as replicas devem ser medidas 
de maneira simultanea, proporcionando um perfeito experimento fotografico. 
Quanto mais tempo levar para coletar todos os dados, mais as condi^oes terao 
mudado desde a primeira ate ultima amostra. Para estudos experimentais, se 
os dados nao forem coletados todos de uma vez, entao a quantidade de tempo 
passado desde a aplica<;ao do tratamento nao sera mais identica para todas as 
replicas. 

Obviamente, quanto maior a escala espacial do estudo, mais dificil e coletar 
todos os dados dentro de uma estrutura de tempo razoavel. Todavia, o saldo pode 
ser maior, porque o escopo da inferencia esta atado a escala espacial das analises: 
conclusoes baseadas em amostras tiradas de apenas um local podem nao ser vali- 
das para outros locais. Contudo, nao ha razao para desenvolver um delineamento 
amostral surreal. Mapeie cuidadosamente seu projeto do comedo ao fim para 
garantir que ele sera factivel.' Uma vez sabendo o numero total de replicas ou 
observances que voce pode coletar, podera come^ar a delinear seu experimento, 
aplicando a Regra dos 10. 

ARegradoslO 

A Regra dos 10 diz que voce deve coletar pelo menos 10 replicas para cada cate- 
goria ou nivel de tratamento. Por exemplo, suponha que tenha determinado que 
possa coletar um total de 50 observances em um experimento, examinando taxas 
fotossinteticas entre diferentes especies de plantas. Um bom delineamento para 
uma ANOVA de um fator ( one-way ) poderia ser comparar as taxas fotossinteticas 
entre nao mais que 5 especies. Para cada uma, voce podera escolher aleatoriamen- 
te 10 plantas e tirar uma medida de cada. 

A Regra dos 10 nao se baseia em nenhum prindpio teorico de delineamento 
experimental ou de analise estatistica, mas e uma reflexao de nossa experiencia de 
campo, obtida atraves de muito esforno, com delineamentos que foram bem-su- 


7 Pode ser bastante informativo usar um cronometro para medir atenciosamente quanto tempo 
leva para completar as medidas em uma unica replica de seu estudo. Como o “pai especialista em 
eficiencia”, em Cheaper by the dozen * (Gilbreth & Carey, 1949), damos muita importancia a tais 
numeros. Com esses dados, podemos estimar com acuracia quantas replicas poderemos fazer em 
uma hora, e quanto tempo de campo no total precisaremos para completar o censo. O mesmo 
prindpio aplica-se ao processamento da amostra, medidas que fazemos no laboratorio, dados que 
passamos para o computador e o armazenamento de longo prazo e curadoria dos dados (ver Ca- 
pitulo 8). Todas essas atividades consomem um tempo que deve ser considerado ao planejar um 
estudo ecologico. 

*N. de T. Este livro foi adaptado para o cinema em 1950 e lan^ado no Brasil com nome de “Papai 
batuta”, sendo regravado e lan^ado no Brasil em 2003 com o nome de “Doze e demais”. 
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cedidos e aqueles que nao foram. Certamente, e possivel analisar conjuntos de da¬ 
dos com menos de 10 observances por tratamento, e frequentemente quebramos 
a regra. Delineamentos balanceados com muitas combina^oes de tratamentos, 
mas com apenas quatro ou cinco replicas, podem ser bastante poderosos. E certos 
delineamentos de uma via com poucos niveis de tratamentos podem requerer 
mais de 10 replicas por tratamento, se as variancias forem grandes. 

Todavia, a Regra dos 10 e um ponto de partida solido. Mesmo se voce es- 
tabelecer o delineamento com 10 observances por nivel de tratamento, e pouco 
provavel que termine com esse numero. A despeito de seus melhores esfor^os, os 
dados podem ser perdidos por uma variedade de razoes, incluindo a falha nos 
equipamentos, os desastres climaticos, as parcelas perdidas, os disturbios ou erros 
humanos, a transcri^ao impropria de dados e as altera^oes ambientais. A Regra 
dos 10 possibilita a coleta de dados com um poder estatistico razoavel para revelar 
padroes. s No Capitulo 7, discutiremos delineamentos experimentais eficientes e 
estrategias para maximizar a quantidade de informa^ao que voce podera extrair 
de seus dados. 

Estudos em larga escala e impactos ambientais 

A Regra dos 10 e util para experimentos manipulativos em pequena escala, nos 
quais as unidades de estudo (parcelas, folhas, etc.) sao de tamanho manejavel. 
Mas ela nao se aplica a experimentos de ecossistemas em larga escala, como a 
manipula^ao de um lago inteiro, pois as replicas podem ser indisponiveis ou 
muito caras. A Regra dos 10 tambem nao se aplica a muitos estudos de impacto 
ambiental, onde a avalia<;ao de um impacto se faz necessaria para um unico 
local. Nesses casos, a melhor estrategia e usar o delineamento ADCI (antes-de- 
pois; controle-impacto). Em alguns delineamentos ADCI, a replica^ao e obtida 
com o passar do tempo: os locais de controle e impactados sao amostrados 
repetidamente, antes e depois do impacto. A falta de replica^ao espacial por si 
so restringe as inferences ao local do impacto (que deve ser o foco do estudo) 
e requer que o impacto nao seja confundido com outros fatores que possam 
co-variar com o impacto. A falta de replica^ao espacial em delineamentos sim¬ 
ples de ADCI e controversa (Underwood, 1994; Murtaugh, 2002b), mas, em 
muitos casos, sao a melhor op«;ao de delineamento (Stewart-Oaten & Bence, 
2001), especialmente se usados em modelagem de series temporais explicitas 
(Carpenter et al., 1989). Retornaremos ao ADCI e suas alternativas nos Capi- 
tulos 7 e 10. 


tS A Regra dos 5 tambem e util. Se voce quiser estimar a curvatura ou a nao linearidade de uma res- 
posta, precisa usar ao menos cinco niveis de variavel preditora. Como discutiremos no Capitulo 7, 
uma solu^ao melhor e usar um delineamento de regressao, no qual a variavel preditora e continua, ao 
inves de categorica e com um numero fixo de niveis. 
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GARANTINDO INDEPENDENCE 

A maioria das analises estatisticas assume que as replicas sao independentes 
umas das outras. Por independencia queremos dizer que as observances coleta- 
das em uma replica nao tern influencia sobre as observances coletadas em outra. 
A falta de independencia e mais facilmente entendida em um contexto experi¬ 
mental. Suponha que voce esta estudando a resposta de beija-flores polinizado- 
res a quantidade de nectar produzido por flores. Voce estabelece duas parcelas 
adjacentes de 5 m x 5 m. Uma parcela e um controle; a adjacente e uma parcela 
com remonao de nectar, da qual voce retira todo o nectar das flores. Alem disso, 
voce mede a visita dos beija-flores as flores das duas parcelas. Na parcela contro¬ 
le, voce mediu, aproximadamente, 10 visitas/hora, comparada a apenas 5 visitas/ 
hora na com remonao. 

Contudo, enquanto coletava os dados, percebeu que uma vez que os passa- 
ros chegavam a parcela de remonao, eles partiam imediatamente, e os mesmos 
passaros visitavam, entao, a parcela-controle adjacente (Figura 6.5A). Obvio, 
os dois conjuntos de observances nao sao independentes um do outro. Se as 
parcelas-controle e de tratamento tivessem sido mais amplamente separadas 
no espano, os numeros obtidos poderiam ser diferentes, e a media de visitas na 
controle poderia ser de apenas 7 visitas/hora, em vez de 10 visitas/hora (Figura 
6.5B). Quando as duas parcelas sao adjacentes uma a outra, a falta de indepen¬ 
dencia infla a diferenna entre elas, talvez levando a um baixo e enganoso valor 
de P e a um erro Tipo I (rejeinao incorreta de uma hipotese nula verdadei- 
ra; ver Capitulo 4). Em outros casos, a falta de independencia pode diminuir 
as diferennas aparentes entre tratamentos, contribuindo para um erro Tipo 
II (aceitar incorretamente uma hipotese nula falsa). Infelizmente, a falta de 
independencia infla ou desinfla tanto o valor de P quanto o poder a graus 
desconhecidos. 

A melhor garantia contra a falta de independencia e assegurar que as replicas 
dentro e entre tratamentos sejam separadas umas das outras por espano ou tempo 
suficientes para garantir que elas nao afetem umas as outras. Infelizmente, raras 
vezes sabemos a distancia ou o espa<;amento que deve haver, e isso e verdade tanto 
para estudos experimentais quanto para observacionais. Devemos usar o senso 
comum e todo o conhecimento biologico quanto possivel. Tente olhar o mundo 
atraves da perspectiva do organismo para imaginar o quao distante deve separar 
as amostras. Estudos-piloto, se viaveis, tambem podem sugerir o espa^amento 
apropriado para garantir independencia. 

Entao, por que nao apenas maximizar a distancia ou o tempo entre as amos¬ 
tras? Primeiro, como descrevemos antes, se torna mais caro coletar dados con- 
forme a distancia entre as amostras aumenta. Segundo, mover as amostras para 
muito longe pode introduzir novas fontes de varia^ao, por causa de diferennas 
(heterogeneidade) dentro ou entre habitats. Queremos nossas replicas perto o su- 
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(A) 



Parcela com Parcela-controle 
remo^ao de nectar 


(B) 



Parcela com Parcela-controle 


remo^ao de nectar 

Figura 6.5 0 problema de falta de independence em estudos ecologicos e ilustrado por urn 

delineamento experimental em que beija-flores forrageiam em busca de nectar em parcelas 
controle e em parcelas das quais o nectar foi removido de todas as flores. (A) Em urn esbo^o 
sem independence, as parcelas com remo^ao de nectar e controle sao adjacentes uma a outra 
e beija-flores que entram na parcela de remo^ao de nectar imediatamente a deixam e come^am 
a forragear na parcela-controle adjacente. Como consequence, os dados coletados na parcela 
controle nao sao independentes dos dados coletados na parcela com remo^ao de nectar: as 
respostas em urn tratamento influenciam as respostas do outro. (B) Se o esbo^o for modificado 
de forma que as parcelas sejam amplamente separadas, os beija-flores que deixarem a parcela 
com remo^ao de nectar nao necessariamente entrarao na parcela-controle. As duas parcelas sao 
independentes e os dados coletados em uma parcela nao serao influenciados pela present da 
outra parcela. Apesar de ser facil ilustrar o problema potencial da falta de independence, na 
pratica pode ser muito dificil saber por antecipa^ao a escala espacial e temporal que garantira 
independence estatfstica. 


ficiente para garantir que estamos amostrando condi<;6es relativamente homoge- 
neas ou consistentes, mas distantes o suficiente para garantir que as respostas que 
medirmos sao independentes umas das outras. 

Apesar de sua importancia central, o problema da independencia quase 
nunca e discutido de forma explicita em artigos cientificos. Na se<;ao dos me- 
todos de um artigo, voce provavelmente lera uma senten^a como: “Medimos 
100 plantulas, selecionadas aleatoriamente, crescendo sob luz solar total. Cada 
plantula medida estava a pelo menos 50 cm de sua vizinha mais proxima ” O que 
os autores querem dizer e: “Nao sabemos quao longe as observances deveriam 
estar umas das outras para garantir independencia. Contudo, 50 cm nos pareceu 
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razoavel para as pequenas plantulas que estudamos. Se tivessemos escolhido dis¬ 
tances maiores que 50 cm, poderiamos nao ter coletado todos os dados sob luz 
solar total, e algumas poderiam ter sido coletadas na sombra, o que, obviamente, 
influenciaria nossos resultados”. 

EVITANDO FAT0RESC0NFUNDID0S 

Quando os fatores se confundem uns com os outros, seus efeitos nao podem ser 
facilmente esclarecidos. Retornando ao exemplo dos beija-flores, suponha que 
prudentemente separamos as parcelas-controle e com remo^ao de nectar, mas, 
sem querer, colocamos a parcela com remo^ao em uma encosta ensolarada e a 
parcela-controle em um vale frio (Figura 6.6). Os beija-flores forrageiam com 
menos frequencia na parcela com remo<;ao (7 visitas/hora), e as duas parcelas 
agora sao distantes o suficiente para garantir que nao ha problemas com indepen¬ 
dence. Contudo, os beija-flores naturalmente tendem a evitar o forrageio no vale 
frio, de modo que a taxa de forrageamento tambem e baixa nessa parcela (6 vi¬ 
sitas/hora). Como os tratamentos se confundem com diferen<;as de temperatura, 
nao podemos separar os efeitos de preferences de forrageamento das preferences 
termais. Nesse caso, as duas formas se anulam, levando as taxas de forrageamento 
comparaveis entre as duas parcelas, embora por razoes muito diferentes. 

Tal exemplo pode parecer um pouco for<;ado. Sabendo a preference termal de 
beija-flores, nao montariamos tal experimento. O problema e que provavelmen- 
te existam variaveis nao medidas ou desconhecidas - mesmo em um ambiente 
aparentemente homogeneo - que podem ter efeitos igualmente fortes em nosso 
experimento. E, se estivermos conduzindo um experimento natural, emperrare- 


Parcela-controle 


Mais fria 


Parcela com 
remogao de nectar 


Maisquente 


Figura 6.6 Um delineamento experimental confundido. Como na Figura 6.5, o estudo estabele- 
ce parcelas-controle e com remo^ao de nectar para avaliar as respostas no forrageamento de bei¬ 
ja-flores. Nesse delineamento, embora as parcelas sejam suficientemente afastadas para garantir 
independence, foram colocadas em pontos diferentes ao longo de um gradiente termal. Por con- 
sequencia, os efeitos dos tratamentos sao confundidos com diferen^as de temperatura. 0 resultado 
h'quido e que o experimento compara dados de uma parcela quente com remo^ao de nectar com 
dados de uma parcela-controle fria. 
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mos em quaisquer fatores confundidos presentes no ambiente. Em um estudo 
observacional do forrageamento de beija-flores, poderemos nao ser aptos para 
encontrar parcelas que difiram apenas em seus niveis de recompensa de nectar, 
mas que tambem nao difiram em temperatura ou outros fatores que sabidamente 
afetam o comportamento de forrageamento. 

REPLICA^AO E RANDOMIZA^AO 

A dupla amea^a dos fatores confundidos e da falta de independencia parece amea- 
9 ar todas as nossas conclusoes estatisticas e ainda trazer suspeitas aos nossos ex- 
perimentos. Incorporar a replica^ao e a randomiza^ao aos delineamentos ex- 
perimentais pode compensar fortemente os problemas introduzidos por fatores 
confundidos e por falta de independencia. Por replica^ao, queremos nos referir 
ao estabelecimento de multiplas parcelas ou as observances dentro do mesmo 
tratamento ou grupo comparado. Por randomiza^ao, referimo-nos a atribuinao 
aleatoria de tratamentos ou a seleqao de amostras. 9 

Vamos retornar mais uma vez ao exemplo dos beija-flores. Se seguirmos os 
principios da randomiza^ao e da replica^ao, estabeleceremos muitas replicas de 
parcelas-controle e com remo<;ao de nectar (idealmente, no minimo 10 de cada). 
A localiza<;ao de cada uma dessas parcelas na area de estudo e aleatoria, e a atri- 
buinao do tratamento (controle ou com remo^ao) a cada parcela tambem sera 
aleatoria (Figura 6.7). 10 

Como a replica^ao e a randomizanao podem reduzir o problema de fatores 
confundidos? Tanto a encosta quente, o vale frio, quanto os diversos locais inter¬ 
mediaries terao parcelas multiplas de controles e de tratamentos com remo^ao de 
nectar. Logo, o fator temperatura nao estara mais confundido com o tratamento, 
como todos os tratamentos ocorrem dentro de cada nivel de temperatura. Como 
beneficio adicional, esse delineamento tambem permitira o teste dos efeitos da 
temperatura como uma covariavel sobre comportamento de forrageamento dos 


9 Muitas amostragens classificadas como aleatorias na verdade sao casuais. Uma amostragem ver- 
dadeiramente aleatoria significa usar um gerador de numeros aleatorios (como o arremesso de 
uma moeda honesta, o lan^amento de um dado honesto ou o uso de um algoritmo de computa- 
dor confiavel para produzir numeros aleatorios) para decidir qual replica usar. Em contraste, com 
amostragem casual, um ecologo segue um conjunto de criterios gerais [p. ex., arvores adultas tern 
um diametro a altura do peito de mais de 3 cm (dap =1,3 m)],ou selecionam locais ou organis- 
mos espa<;ados homogeneamente, ou por conceniencia, dentro da area amostral. Muitas vezes e 
necessario amostrar casualmente em algum nivel, porque a amostragem aleatoria nao e eficiente 
para muitos tipos de organismos, em especial se sua distribui^ao e espacialmente agregada, for- 
mando manchas. Contudo, uma vez que um conjunto de organismos ou de locais e identificado, a 
randomiza^ao deve ser usada para amostrar ou para atribuir os diferentes grupos de tratamentos 
as replicas. 

10 A randomiza^ao leva algum tempo, e voce deve randomizar o maximo possivel antes de ir ao 
campo. E facil gerar numeros aleatorios e simular amostragem aleatoria com planilhas de com- 
putador. Porem, muitas vezes sera o caso de voce precisar gerar numeros aleatorios em campo. 
Moedas e dados (especialmente dados de 10 faces) sao uteis para esse proposito. Um estratagema 

( Continua ) 
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Figura 6.7 Um delineamento experimental devidamente replicado e aleatorizado. 0 estudo es- 
tabelece parcelas como na Figura 6.6. Cada quadrado representa uma replica da parcela-controle 
(pontos pretos) ou da parcela com remo^ao de nectar (pontos cinzas). As parcelas sao separadas 
por distancia suficiente para garantir independence, mas sua localiza^ao dentro do gradiente de 
temperatura foi aleatorizada. Ha 10 replicas para cada um dos dois tratamentos. A escala espacial 
desse desenho e maior que na Figura 6.6. 


beija-flores, independente dos niveis de nectar (ver Capitulos 7 e 10). E verdade 
que a visita^ao dos beija-flores ainda sera mais frequente na encosta quente que 
no vale frio, mas isso sera verdadeiro tanto para as replicas quanto para as com 
remo^ao de nectar. A temperatura ira adicionar mais varia^ao aos dados, mas 
isso nao conduzira os resultados, porque as parcelas quentes e as frias estarao 
aproximadamente distribuidas em igualdade entre os tratamentos controle e com 
remo<;ao. £ claro, se soubessemos por antecipa^ao que a temperatura seria um 
importante determinante do comportamento de forrageamento, poderiamos nao 
ter usado esse delineamento para o experimento. A randomiza^ao minimiza a 


10 {Continuagao) 

esperto e usar um conjunto de moedas como um gerador de numeros aleatorios binarios. Por 
exemplo, suponha que voce devera atribuir a cada uma de suas replicas um tratamento dentre 
8 possibilidades, e voce deseja fazer isso de maneira aleatoria. Arremesse 3 moedas e converta o 
padrao de caras e coroas em um numero binario (i. e., um numero na base 2). Assim, a primeira 
moeda indica os l(s), a segunda moeda indica os 2(s) e a terceira moeda indica os 4(s), e assim por 
diante. O arremesso de 3 moedas resultara um numero aleatorio entre 0 e 7. Se os tres arremessos 
derem cara, coroa, cara (CACOCA), voce tera um 1 no lugar do 1, um 0 no lugar do 2, e 1 no lugar 
4. Seu numero aleatorio sera 1 +0 + 4 = 5. Um lan<;amento (COCACO) dara 0 + 2 + 0 = 2. Tres 
coroas dariam 0 (0 +0 + 0) e tres caras dariam 7 (1 + 2 + 4). Arremessar 4 moedas resultara em 16 
numeros inteiros e 5 moedas, 32. 

Um metodo ainda mais simples e levar um cronometro digital para o campo. Deixe o crono- 
metro correr por alguns segundos e pare-o sem olhar para ele. O ultimo digito que mede a hora 
em centesimos de segundo pode ser usado como um digito aleatorio uniforme de 0 a 9. A analise 
estatistica de 100 desses digitos aleatorios passou em todos os testes diagnostics padrao para testar 
aleatoriedade e uniformidade (B. Inouye, comunica^ao pessoal). 
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confusao dos tratamentos com variaveis desconhecidas, ou nao medidas, na area 
de estudo. 

£ menos obvio como a randomiza<;ao e a replica^ao reduzem o problema de 
falta de independence entre amostras. Afinal de contas, se as parcelas sao muito 
proximas umas das outras, as visitas de forrageamento nao serao independentes, 
nao dependendo da quantidade de replicas ou de randomiza«;ao. Sempre que pos- 
slvel, devemos usar o senso comum e o conhecimento de biologia para separar 
parcelas ou amostras por uma distancia ou um intervalo amostral minimo, a fim 
de evitar dependence. Contudo, se nao conhecemos todas as formas que causam a 
dependence, a disposi^ao aleatoria das parcelas acima de uma determinada dis¬ 
tancia minima ira garantir que o espa^amento entre as parcelas seja variavel. Al- 
gumas parcelas ficarao relativamente proximas e outras, longe. Portanto, o efeito 
da dependence sera forte entre alguns pares de parcelas, fraco entre outros e nao 
existira entre o restante. Tais efeitos variaveis podem cancelar um ao outro e po- 
dem reduzir as chances de que os resultados sejam consistentemente conduzidos 
pela falta de independence. 

Por fim, note que a randomiza^ao e a replica<;ao somente sao efetivas quando 
usadas em conjunto. Se nao replicarmos, mas simplesmente atribuirmos de for¬ 
ma aleatoria as parcelas-controle e de tratamento para a encosta ou para o vale, o 
delineamento ainda assim sera confundido (Figura 6.6). Similarmente, se repli¬ 
carmos o delineamento, mas atribuirmos todos os 10 controles no vale a todas as 
10 replicas com remo^ao na encosta, o delineamento tambem sera confundido 
(Figura 6.8). £ somente quando usamos multiplas parcelas e atribuimos os tra¬ 
tamentos aleatoriamente que o efeito confundido da temperatura e removido do 
delineamento (Figura 6.7). De fato, e justo dizer que qualquer delineamento sem 
replicas sempre vai ser confundido com um ou mais fato res ambientais." 

Apesar do conceito de randomizat^ao ser simples, ele precisa ser aplicado em 
varios estagios do delineamento. Primeiro, a randomiza^ao se aplica somente a um 
espa<;o amostral bem-definido e inicialmente nao aleatorio. O espa<;o amostral nao 
significa simplesmente a area fisica da qual as replicas sao amostradas (embora este 
seja um aspecto importante do espa^o amostral). Em vez disso, o espa^o amostral se 
refere a um conjunto de elementos que possuem condi^oes similares, nao identicas. 


11 Apesar de fatores confundidos serem faceis de reconhecer em um experimento de campo desse 
tipo, nao quer dizer que o mesmo problema exista em experimentos de laboratorio ou em casas de 
vegeta^ao (estufas). Se nos criamos larvas de insetos em temperaturas altas e baixas em duas camaras 
ambientais, esse sera um delineamento confundido, porque todas as larvas de temperatura alta esta¬ 
rao em uma camara e todas as de temperatura baixa estarao em outra. Se outros fatores ambientais, 
que nao a temperatura, tambem difiram entre as camaras, seus efeitos estarao confundidos com 
a temperatura. A solu^ao correta seria criar cada larva em camaras individuals, garantindo, desse 
modo, que cada replica seja verdadeiramente independente e que a temperatura nao seja confundida 
com outros fatores. Mas esse tipo de delineamento e muito oneroso e e um desperdicio de espa^o 
emprega-lo. Talvez se possa argumentar que as camaras ambientais ou casas de vegeta^ao realmente 
diferem apenas em temperatura e em nenhum outro fator, mas esse e apenas um pressuposto que 
deve ser testado de maneira explicita. Em muitos casos, o ambiente em camaras ambientais e sur- 
preendentemente heterogeneo, tanto dentro quanto entre camaras. Potvin (2001) discute como esta 
variabilidade pode ser medida e entao utilizada para delinear melhor experimentos de laboratorio. 
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Figura 6.8 Um delineamento replicado, porem confuso. Como nas Figuras 6.5,6.6 e 6.7, o estudo 
estabelece parcelas experimentais de controle e com remogao de nectar para avaliar as respostas 
no forrageamento de beija-flores. Cada quadrado representa uma parcela-controle (pontos pretos) 
ou parcelas com remo^ao de nectar (pontos cinza). Se os tratamentos forem replicados, mas nao 
atribuidos aleatoriamente, o delineamento ainda confunde tratamento com gradientes ambientais 
adjacentes. A replicagao combinada com randomiza^ao e espa^amento suficiente entre as replicas 
(Figura 6.7) e a unica garantia contra a falta de independence (Figura 6.5) e fatores confundidos 
(Figuras 6.6 e 6.8). 


Exemplos de um espa^o amostral podem incluir individuos de trutas que es- 
tao reprodutivamente maduros, clareiras criadas por incendios, antigos campos 
abandonados 10-20 anos atras, ou grandes corais branqueados* * de 5 a 10 metros 
de profundidade. Se esse espa<;o amostral foi definido claramente, locais, indivi- 
duos ou replicas que cumpram o criterio devem ser escolhidos de maneira alea- 
toria. Como notamos no Capitulo 1, as fronteiras espaciais e temporais do estudo 
ditarao nao apenas o esfor^o amostral envolvido, mas tambem o dominio de infe- 
rencia para as conclusoes do estudo. 

Uma vez que os locais ou as amostras sao selecionados aleatoriamente, os 
tratamentos devem ser atribuidos a eles sem obedecer ordens ou coloca^oes, 
garantindo que tratamentos diferentes nao fiquem agrupados no espa^o ou se- 
jam confundidos com variaveis ambientais. 1 " Tantos as amostras quanto os tra- 


Se o numero de amostras e muito pequeno, mesmo a atribui^ao aleatoria pode levar a uma agrega- 
$ao espacial dos tratamentos. Uma solu^ao poderia ser estabelecer os tratamentos em ordem repetida 
(...123123...), o que garante a nao agrega^ao. Porem, se ha falta de independencia entre tratamentos, 
esse delineamento pode exagerar seus efeitos, porque o tratamento 2 sempre ira ocorrer espacial- 
mente entre os de numero 1 e 3. Uma solu^ao melhor seria repetir a randomiza^ao e, entao, testar 
estatisticamente a conforma^ao para garantir que nao haja agrega^ao. Ver Hurlbert (1984) para uma 
discussao aprofundada dos numerosos riscos que podem surgir ao falhar em replicar e randomizar 
adequadamente experimentos ecologicos. 

*N. de T. O branqueamento (do ingles bleaching) e a perda dos organismos fotossimbiontes (zoo- 
xantelas) presentes nos tecidos do coral. O tecido vivo dos corais sem as algas e translucido, e por isso 
o esqueleto feito de carbonato de calcio fica exposto, resultando no coral branqueado. 
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tamentos devem ser coletados e aplicados, respectivamente, de forma aleatoria. 
Dessa forma, se as condi<;6es ambientais mudarem durante o experimento, os 
resultados nao serao confundidos. Por exemplo, se voce faz o censo de os seus 
controles primeiro, e seu trabalho de campo e interrompido por uma violenta 
tempestade, quaisquer impactos do mau tempo serao confundidos com suas 
manipulates, pois o censo em todas as parcelas de tratamento sera feito depois 
da tempestade. Essas mesmas ressalvas se aplicam a estudos nao experimentais, 
nos quais sera feito o censo em diferentes parcelas ou locais. A advertencia e que 
fazer o censo aleatorio apenas dessa forma pode ser muito ineficiente, porque 
voce em geral nao visitara locais proximos em uma ordem consecutiva. Voce 
pode ter de fazer um compromisso entre a randomiza^ao estrita e as restri^oes 
impostas pela eficiencia amostral. 

Todos os metodos de analises estatisticas - sejam eles parametricos, Monte 
Carlo, ou bayesianos (ver Capitulo 5) - recaem sobre o pressuposto de amostra- 
gem aleatoria em uma escala espacial ou temporal apropriada. Voce deve adquirir 
o habito de empregar a randomiza^ao sempre que possivel em seu trabalho. 

DELINEANDO EXPERIMENTOS DE CAMPO E ESTUDOS AMOSTRAIS EFETIVOS 

Aqui, estao algumas questoes a serem feitas quando delineamos experimentos de 
campo e estudos amostrais. Embora algumas pare^am ser espedficas a experi¬ 
mentos manipulativos, elas tambem sao relevantes a certos experimentos natu¬ 
ral, onde os “controles” podem consistir em parcelas sem uma especie em parti¬ 
cular ou sem um conjunto de condi^oes abioticas. 

As parcelas ou os cercados sao grandes o suficiente para garantir resultados reah'sticos? 

Experimentos de campo que buscam controlar a densidade de animais devem 
necessariamente restringir o seu movimento. Se os cercados forem muito pe- 
quenos, o movimento, o forrageamento e os comportamentos reprodutivos 
dos animais podem ser falsos e, por conseguinte, os resultados obtidos nao 
serao interpretaveis (MacNally, 2000a). Tente usar a maior parcela, ou gaiola, 
viavel e apropriada para o organismo que esteja estudando. As mesmas consi- 
dera^oes se aplicam aos estudos amostrais: as parcelas precisam ser grandes o 
suficiente e amostradas em uma escala espacial apropriada para responder sua 
questao. 

Qual e o grao e a extensao do estudo? 

Embora muita importancia tenha sido depositada na escala espacial de um ex¬ 
perimento ou de um estudo amostral, existem, na verdade, dois componentes da 
escala espacial que precisam ser discutidos: o grao e a extensao. O grao e o tama- 
nho da menor unidade do estudo, que geralmente sera o tamanho de uma replica 
ou parcela individual. A extensao e a area total englobada por todas as unidades 
amostrais no estudo. O grao e a extensao tanto podem ser grandes quanto pe- 
quenos (Figura 6.9). Nao ha uma combina^ao unica de grao e extensao que seja 
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Pequena Grande 
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Figura 6.9 Grao espacial e extensao espacial em estudos ecologicos. Cada quadrado repre- 
senta uma unica parcela. 0 grao espacial mede o tamanho das unidades amostrais, represen- 
tada por quadrados pequenos ou grandes. A extensao espacial mede a area que engloba todas 
as replicas do estudo, representada por quadrados agrupados bem proximos ou amplamente 
espagados. 


necessariamente correta. Contudo, estudos ecologicos com pequena granula^ao e 
pequena extensao, como a captura de besouros com armadilhas do tipo pitfall em 
uma unica parcela de floresta, podem, por vezes, ter um escopo muito limitado 
para permitir conclusoes amplas. Por outro lado, estudos com um grande grao, e 
pequena extensao, como a manipulate de lagos inteiros em um unico vale, po¬ 
dem ser bastante informativos. Nossa preferencia e por estudos com um grao pe- 
queno, mas extensao media ou grande, como os censos de formigas e plantas em 
pequenas parcelas (5 m x 5 m) ao longo de todo o estado da Nova Inglaterra [New 
England ] (Gotelli & Ellison, 2002a,b) ou da America do Norte oriental (Gotelli & 
Arnett, 2000), ou em pequenas ilhas de mangue no Caribe (Farnsworth & Ellison, 
1996a). O grao pequeno per mite manipulates experimentais e observances feitas 
em escalas que sao relevantes para o organismo, mas a larga extensao expande o 
dominio de inferencia dos resultados. Ao determinar o grao e a extensao, voce 
deve considerar tanto a questao que esta tentando responder como as restrinoes 
sobre sua amostragem. 

A amplitude dos tratamentos ou das categorias dos censos engloba ou abrange a amplitude 
de condites ambientais possiveis? 

Muitos experimentos de campo descrevem suas manipulates como “englobando 
ou abrangendo a gama de condites encontradas no campo.” Contudo, se voce 
esta tentando modelar uma mudan^a climatica, ou ambientes alterados, pode ser 
necessario incluir, tambem, condites que estao fora da amplitude daquelas nor- 
malmente encontradas em campo. 
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Foram estabelecidos controles apropriados para garantir que os 
resultados refletem varia^ao apenas no fator de interesse? 

E raro que uma manipulate* ira mudar um, e apenas um fator por vez. Por exem- 
plo, se voce cercar plantas com uma gaiola para excluir herbivoros, voce tam- 
bem tera alterado o sombreamento e o regime de umidade. Se voce simplesmente 
comparar essas plantas a controles sem manipula^ao, os efeitos dos herbivoros 
estarao confundidos com as diferen^as de sombreamento e umidade. O erro mais 
comum em delineamentos experimentais e estabelecer um conjunto de parcelas 
sem manipulate) e trata-las como controle. Em geral, um conjunto adicional de 
parcelas-controle, que contenham um minimo de alterato, sera necessario para 
controlar de maneira adequada as manipulates. No exemplo retromencionado, 
uma gaiola com um dos lados aberto permitira o acesso de herbivoros, mas ainda 
incluira os efeitos do sombreamento da gaiola. Com esse simples delineamento de 
tres tratamentos (sem manipula^ao, gaiola controle, exclusao de herbivoros) ,voce 
podera fazer os seguintes contrastes: 

1. Sem manipula$ao versus Gaiola controle. Esta compara^ao revela a extensao 
na qual o sombreamento e as mudan^as fisicas devido a gaiola per se estao 
afetando o crescimento e respostas das plantas. 

2. Gaiola controle versus Exclusao de herbivoros. Esta compara^ao revela a ex¬ 
tensao na qual a herbivoria afeta o crescimento das plantas. Tanto as parcelas 
controle quanto as de exclusao de herbivoros sofrem os efeitos de sombrea¬ 
mento da gaiola. Assim, qualquer diferen<;a entre elas pode ser atribuida ao 
efeito dos herbivoros. 

3. Sem manipula$ao versus Exclusao de herbivoros. Esta compara^ao mensura o 
efeito combinado dos herbivoros com o do sombreamento no crescimento 
das plantas. Como o experimento e delineado para medir apenas o efeito dos 
herbivoros, esta compara^ao em particular confunde entre os efeitos dos tra¬ 
tamentos com os gerados pelo uso da gaiola. 

No Capitulo 10, explicaremos como voce pode usar contrastes apos uma ana- 
lise de variancia para quantificar essas compara^oes. 

Todas as replicas foram manipuladas da mesma forma, exceto para a 
aplica^ao intencional do tratamento? 

Novamente, controles apropriados em geral requerem mais que ausencia de 
manipula^ao. Se voce precisar “empurrar” as plantas para aplicar o tratamento, 
deve fazer o mesmo com as plantas das parcelas-controle (Salisbury, 1963, Jaffe, 
1980). Em um experimento de transplante reciproco de larvas de insetos, ani- 
mais vivos podem ser enviados via correio para locais distantes e inseridos em 
novas populates, no campo. O controle apropriado e um conjunto de animais 
que sao reinseridos nas populates das quais eles foram coletados. Esses animais 
tambem deverao receber o mesmo “tratamento postal”, sendo enviados pelo sis- 
tema de correios para garantir que eles recebam a mesma carga de estresse que 
aqueles que foram transplantados para locais distantes. Se voce nao for cuida- 



Prindpios de Estati'stica em Ecologia 179 


doso de garantir que todos os organismos foram tratados identicamente em seu 
experimento, seus tratamentos serao confundidos com os efeitos da manipula¬ 
te (Cahill et al., 2000). 

As covariaveis apropriadas foram medidas em cada replica? 

As covariaveis sao variaveis continuas {ver Capitulo 7) que afetam muito a varia- 
vel resposta, mas nao sao necessariamente controladas ou manipuladas pelo pes- 
quisador. Exemplos incluem as varia^oes de temperatura, de sombreamento, de 
pH ou de densidade de herbivoros entre parcelas. Diferentes metodos estatisticos, 
como a analise de covariancia (ver Capitulo 10), podem ser usados para quantifi- 
car o efeito de covariaveis. 

Contudo, voce deve evitar a tenta^ao de medir todas as covariaveis conce- 
biveis em uma parcela apenas porque tern a instrumenta^ao (e o tempo) para 
faze-lo. Voce rapidamente terminara com um conjunto de dados em que tera 
mais variaveis medidas do que tern de replicas, causando problemas adicionais 
na analise (Burnham & Anderson, 2002). E melhor escolher por antecipa^ao as 
covariaveis mais relevantes biologicamente, mensurar apenas aquelas covariaveis 
e usar a replica^ao suficiente. Lembre-se tambem, de que a mensura^ao de cova¬ 
riaveis tambem e util, mas nao e um substituto para a randomiza^ao e replica^ao 
adequadas. 


RESUM0 


O bom delineamento de um experimento em ecologia requer primeiro o claro 
estabelecimento de uma questao a ser respondida. Tanto experimentos manipula- 
tivos como observacionais podem responder perguntas ecologicas, e cada tipo de 
experimento tern suas proprias formas e fraquezas. Pesquisadores devem conside- 
rar a adequanao de utilizar um experimento de pressao versus um de pulso, e se a 
replica<;ao sera no espa«;o (experimentos fotograficos), no tempo (experimentos 
de trajetoria), ou em ambos. A falta de independence e fa tores confundidos po¬ 
dem comprometer a analise estatistica dos dados, tanto de estudos manipulativos, 
quanto observacionais. A randomiza^ao, a replica<;ao e o conhecimento de ecolo¬ 
gia e da historia natural dos organismos sao as melhores garantias contra a falta 
de independence e os fatores confundidos. Sempre que possivel, tente usar no 
minimo 10 observances por grupo de tratamentos. Experimentos de campo ge- 
ralmente requerem controles delineados com cautela, levando em conta efeitos de 
manipula<;ao e outras alteranoes nao intencionais. A medida de covariaveis am- 
bientais apropriadas podem ser utilizadas para explicar a varia<;ao nao controlada, 
embora ela nao seja um substituto para a randomizanao e para a replicanao. 



< 
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7 

Um Bestiario* 
de Delineamentos 
Experimentais e Amostrais 


E m um estudo experimental, precisamos decidir sobre um conjunto de 
manipulates biologicamente realistas que incluam controles apropria- 
dos. Em um estudo observational, temos de decidir quais variaveis medir para 
melhor responder As questoes que descobrimos. Essas decisoes sao muito im- 
portantes e foram o assunto do Capitulo 6. Nesse capitulo discutimos, ainda, 
delineamentos espedficos para estudos experimentais e amostrais em ecolo- 
gia e ciencia ambiental. O delineamento de um experimento ou estudo obser¬ 
vational se refere a como as replicas sao fisicamente organizadas no espat e 
como sao amostradas com o passar do tempo. O delineamento do experimento 
esta intimamente ligado aos detalhes de replica^ao, randomiza^ao e indepen¬ 
dence (ver Capitulo 6). Certos tipos de delineamentos tern se revelado muito 
robustos para a interpreta<;ao e analise de dados de campo. Outros sao mais 
dificeis para analisar e interpretar. No entanto, voc£ nao consegue tirar leite de 
pedra, e mesmo as analises estatisticas mais sofisticadas nao podem salvar um 
delineamento ruim. 

Primeiro, apresentamos um esquema de trabalho simples para classificar os 
delineamentos de acordo com os tipos de variaveis, se dependentes ou indepen- 
dentes. Depois, descrevemos um pequeno numero de delineamentos uteis em 
cada categoria. Discutimos cada um e os tipos de questoes que eles podem ser 
usados para resolver, os ilustramos com um conjunto de dados simples e descre¬ 
vemos as vantagens e desvantagens de cada caso. Os detalhes de como analisar 
dados a partir desses delineamentos estao nos Capitulos 9 a 12. 


* N. de R.T. Ver nota da p. XI. 
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A literatura sobre delineamentos experimentais e amostrais e vasta (p. ex., 
Cochran & Cox, 1957; Winer, 1991; Underwood, 1997; Quinn & Keough, 2002) 
e aqui apresentamos apenas uma seleta cobertura. Nos restringimos aos deline¬ 
amentos que sao praticos e uteis para ecologos e cientistas ambientais e que te- 
nham se revelado bem-sucedidos em estudos de campo. 

VARIAVEIS CATEGORICAS Vf/?5f/5 VARIAVEIS CONTINUAS 

Primeiro distinguiremos variaveis categoricas e variaveis continuas. As varia- 
veis categoricas sao classificadas em uma entre duas ou mais categorias. Exemplos 
ecologicos incluem sexo (macho, femea), categoria trofica (produtor, herbivoro, 
carnivoro) e tipo de habitat (sombra, sol). As variaveis continuas sao medidas em 
uma escala numerica continua, podendo assumir uma gama de numeros reais 
ou valores inteiros. Exemplos incluem as medidas do tamanho de individuos, a 
riqueza de especies, a cobertura de habitats e a densidade populacional. 

Muitos textos de estatistica realizam uma distin^ao adicional entre varia¬ 
veis puramente categoricas, nas quais as categorias nao sao variaveis ordenadas, 
e “ranqueadas” (ou ordinais), cujas categorias sao ordenadas com base em uma 
escala numerica. Um exemplo de variavel ordinal pode ser um escore numerico 
(0,1,2,3 ou 4) atribuido a quantidade de luz solar que atinge o solo da floresta: 0 
para 0-5% de luz; 1 para 6-25%; 2 para 26-50%; 3 para 51-75%; e 4 para 76-100%. 
Em muitos casos, os metodos utilizados para analisar dados continuos tambem 
podem ser aplicados a dados ordinais. Em poucos, no entanto, os dados ordinais 
sao melhor analisados com metodos de Monte Carlo, discutidos no Capitulo 5. 
Neste livro, usamos o termo variavel categorica para nos referirmos tanto a varia¬ 
veis categoricas ordenadas quanto as nao ordenadas. 

A distin^ao entre variaveis continuas e categoricas nem sempre e obvia: em 
varios casos, a designa^ao depende simplesmente de como o investigador esco- 
lheu medir a variavel. Por exemplo, uma variavel categorica de habitat como sol/ 
sombra poderia ser medida, em uma escala continua, usando um medidor de luz 
e registrando a intensidade luminosa em diferentes lugares. Ao contrario, uma 
variavel continua como a salinidade poderia ser classificada em tres niveis (baixo, 
medio, e alto) e tratada como uma variavel categorica. Reconhecer o tipo de varia¬ 
vel que voce esta medindo e importante, pois diferentes delineamentos se baseiam 
em variaveis categoricas e em continuas. 

No Capitulo 2, distinguimos dois tipos de variaveis aleatorias: as discretas e 
as continuas. Qual a diferen«;a entre variaveis aleatorias discretas ou continuas 
por um lado e entre variaveis categoricas e continuas por outro? Variaveis aleato¬ 
rias discretas ou continuas sao fun^oes matematicas para gerar valores associados 
com distributes de probabilidade. Em contraste, variaveis categoricas e conti¬ 
nuas descrevem os tipos de dados que nos realmente medimos em campo ou em 
laboratorio. Variaveis continuas em geral podem ser modeladas como variaveis 
aleatorias continuas, enquanto tanto as categoricas quanto as ordinais geralmente 
podem ser modeladas como variaveis aleatorias discretas. Por exemplo, a variavel 
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categorica sexo pode ser modelada como uma variavel aleatoria binomial; a varia- 
vel numerica altura pode ser modelada como aleatoria normal; e a variavel ordi¬ 
nal luz atingindo o solo dafloresta pode ser modelada como aleatoria binomial, de 
Poisson, ou uniforme. 

VARIAVEIS DEPENDENTES EINDEPENDENTES 

Apos identificar os tipos de variaveis com as quais voce esta trabalhando, o proxi¬ 
mo passo e designar as variaveis dependentes e as independentes. Esta atribui^ao 
implica uma hipotese de causa e efeito que voce esta tentando testar. A do tipo 
dependente e a variavel resposta, que voce esta medindo e para a qual voce esta 
tentando determinar as causas. Em um grafico de dispersao de duas variaveis, a 
dependente ou resposta e chamada de variavel Y, e geralmente e plotada na orde- 
nada (eixo vertical ou y). A do tipo independente e a variavel preditora, que voce 
supoe ser responsavel pela altera^ao na variavel resposta. No mesmo grafico de 
dispersao das duas variaveis, a independente ou preditora e chamada de variavel 
X , e em geral e plotada na abscissa (eixo horizontal ou x). 1 

Em um estudo experimental, voce com frequencia manipula ou controla 
diretamente os niveis da independente e mede a resposta da dependente. Em 
um estudo observacional, voce depende da varia^ao natural da variavel inde¬ 
pendente entre as replicas. Tanto em estudos naturais quanto em observacio- 
nais, voce nao sabe de antemao o poder da variavel preditora. De fato, testa 
com frequencia a hipotese nula estatistica de que a instabilidade na variavel 
resposta nao e relacionada com a da variavel preditora, bem como nao e maior 
que o esperado ao acaso ou por erro amostral. A hipotese alternativa e que o 
acaso nao pode responder completamente por essa varia^ao e que ao menos 
parte dela pode ser atribuida a variavel preditora. Voce tambem pode estar 
interessado em estimar a magnitude do efeito do preditor ou variavel causal 
sobre a variavel resposta. 

QUATRO CLASSES DE DELINEAMENTOS EXPERIMENTAL 

Combinando os tipos de variaveis - categorica versus continua, dependente ver¬ 
sus independente - obtemos quatro classes diferentes de delineamentos (Tabela 
7.1). Quando as variaveis independentes forem continuas, as classes sao regressao 
(variaveis dependentes continuas) ou regressao logistica (variaveis dependentes 
categoricas). Quando as variaveis independentes sao categoricas, as classes sao 
ANOVA (variavel dependente continua) ou tabular (variavel dependente cate¬ 
gorica). Nem todos os delineamentos se ajustam de maneira satisfatoria nessas 
quatro categorias. A analise de covariancia (ANCOVA) e usada quando existem 


1 Naturalmente, apenas plotar uma variavel no eixo-x nao e uma garantia de que ela realmente seja a 
variavel preditora. Em experimentos naturais, em especial, a dire^ao de causa e efeito nem sempre e 
clara, mesmo que as variaveis medidas possam ser altamente correlacionadas (ver Capitulo 6). 
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TABELA 7.1 Quatro classes de delineamentos experimentais e amostrais 



Variavel independente 

Variavel dependente 

Continua 

Categorica 

Continua 

Regressao 

ANOVA 

Categorica 

Regressao logistica 

Tabular 


Diferentes tipos de delineamentos sao usados dependendo de quando as variaveis independentes e depen- 
dentes sao continuas ou categoricas. Quando ambas forem continuas, um delineamento de regressao e 
usado. Se a variavel dependente e categorica e a variavel independente e continua, emprega-se um delinea¬ 
mento de regressao logistica. A analise de delineamentos de regressao e tratada no Capitulo 9. Se a variavel 
independente e categorica e a variavel dependente e continua, usa-se um delineamento de analise de va- 
riancia (ANOVA). A analise de delineamentos de ANOVA e descrita no Capitulo 10. Por fim, se as variaveis 
dependentes e independente forem categoricas, usa-se, entao, um delineamento tabular. A analise de dados 
tabulares e descrita no Capitulo 12. 


duas variaveis independentes, uma que e categorica e outra que e continua (a 
covariavel). A ANCOVA e discutida no Capitulo 10. A Tabela 7.1 categoriza dados 
univariados, nos quais existe uma unica variavel dependente. Se, em vez disso, 
tivermos um vetor de variaveis dependentes correlacionadas, contamos com a 
analise de variancia multivariada (MANOVA) ou outros metodos multivariados 
descritos no Capitulo 12. 

Delineamentos de regressao 

Quando as variaveis independentes sao medidas em escalas numericas conti¬ 
nuas (ver Figura 6.1 para um exemplo), o esquema amostral e um delineamento 
de regressao. Se a variavel dependente tambem e medida em uma escala conti¬ 
nua, usamos modelos de regressao linear ou nao linear para analisar os dados. 
Se e medida em uma escala ordinal (uma resposta ordenada), usamos regressao 
logistica. Estes tres tipos de modelos de regressao sao discutidos em detalhes no 
Capitulo 9. 

Regressao de um fator Um delineamento de regressao e simples e intuitivo. 
Colete dados em um conjunto de replicas independentes. Para cada replica, me^a 
as variaveis preditora e a resposta. Em um estudo observacional, nenhuma das 
duas variaveis e manipulada, e sua amostragem e ditada pelos niveis de varia<;ao 
natural da variavel independente. Por exemplo, suponha que sua hipotese seja de 
que a densidade de roedores do deserto seja controlada pela disponibilidade de 
sementes (Brown & Leiberman, 1973). Voce poderia amostrar 20 parcelas inde¬ 
pendentes, cada uma escolhida para representar um nivel diferente de abundancia 
de sementes. Em cada parcela, voce mede a densidade de sementes e a densidade 
de roedores do deserto (Figura 7.1). Os dados sao organizados em uma planilha, 
na qual cada linha e uma parcela diferente, e cada coluna e uma variavel preditora 
ou resposta diferente. Os valores em cada linha representam as medidas obtidas 
em uma unica parcela. 
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Em um estudo experimental, os niveis da variavel preditora sao controlados 
e manipulados diretamente, e voce mede a variavel resposta. Como sua hipotese 
e de que a densidade de sementes e responsavel pela de roedores do deserto (e 
nao o contrario), voce poderia manipular a densidade de sementes em um estu¬ 
do experimental, seja adicionando ou removendo sementes para alterar sua dis- 
ponibilidade para os roedores. Tanto no estudo experimental quanto no obser- 
vacional, seu pressuposto e de que a variavel preditora e uma causal: mudan^as 
no valor do preditor (densidade de sementes) poderiam causar uma altera^ao no 
valor da variavel resposta (densidade de roedores). Isto e muito diferente de um 
estudo em que voce poderia examinar a correla^ao (covariancia estatistica) entre 
duas variaveis. A correla^ao nao especifica uma rela^ao de causa e efeito entre as 
duas variaveis. 2 

Em adi^ao as ressalvas usuais de replica^ao adequada e independence dos 
dados (Capitulo 6), dois prindpios devem ser seguidos ao delinear um estudo de 
regressao: 

1. Garanta que a amplitude dos valores amostrados para a variavel preditora cap¬ 
ture toda agama de respostas da variavel resposta. Se a preditora for amostrada 
em uma amplitude muito limitada, pode surgir uma rela^ao estatistica fraca 
ou inexistente entre as variaveis preditora e resposta, mesmo que elas sejam 
relacionadas (Figura 7.2). Uma gama de amostragem limitada torna o estudo 
suscetivel ao erro estatistico do Tipo II (falha em rejeitar uma hipotese nula 
falsa; ver Capitulo 4). 

2. Garanta que a distribui^ao dos valores do preditor seja aproximadamente 
uniforme dentro da amplitude de amostragem. Cuidado com conjuntos de 
dados em que um ou dois dos valores da variavel preditora sejam mui¬ 
to diferentes em grandeza dos outros. Tais pontos de influencia podem 
dominar a inclina^ao da regressao e gerar relates significativas onde ela 
nao existe de verdade (Figura 7.3; ver Capitulo 8 para discussao adicional 
sobre dados discrepantes). Algumas vezes, os pontos de influencia podem 


2 O esquema de amostragem precisa refletir os objetivos do estudo. Se este for delineado simples- 
mente para documentar a rela^ao entre a densidade de sementes e de roedores, entao uma serie de 
parcelas aleatorias podem ser selecionadas; a correla^ao e usada para explorar a rela^ao entre as 
duas variaveis. No entanto, se a hipotese for de que a densidade de sementes seja responsavel pela 
densidade de roedores, entao uma serie de parcelas que englobem uma gama uniforme de densi¬ 
dade de sementes deve ser amostrada; a regressao e usada para explorar a dependencia funcional 
da abundancia de roedores pela densidade de sementes. Idealmente, as parcelas amostradas devem 
diferir uma da outra apenas na densidade de sementes presente. Outra distincao importante e que 
uma verdadeira analise de regressao assume que o valor da variavel independente seja exatamente 
conhecido e que nao esta sujeito a erros de medi<;ao. Por fim, a regressao linear padrao minimiza os 
desvios residuais apenas na dire^ao vertical (y), enquanto correla^ao minimiza a distancia perpen¬ 
dicular (x e y) de cada ponto ate a linha de regressao (tambem chamada de regressao Modelo II). A 
distincao entre correla^ao e regressao e sutil e frequentemente confusa, porque algumas estatisticas 
(como o coeficiente de correla<;ao) sao identicas para ambos os tipos de analises. Ver Capitulo 9 
para mais detalhes. 
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Parcela 2 

Densidadede roedores: 1,1 
Densidade de sementes: 1.500 
Cobertura de vegeta?ao: 2 


Parcela 1 

Densidade de roedores: 5,0 
Densidade de sementes: 12.000 
Cobertura de vegetagao: 11 


Numero 
da parcela 

Sementes/m 2 

Cobertura 
de vegeta^ao (%) 

Roedores/m 2 

1 

12.000 

11 

5,0 

2 

1.500 

2 

1,1 



. 

. 





20 

11.500 

52 

3,7 


Figura 7.1 Arranjo espacial das replicas para um estudo de regressao. Cada quadrado representa 
uma parcela de 25m 2 diferente. As parcelas foram amostradas para garantir uma cobertura unifor¬ 
me da densidade de sementes (ver Figuras 7.2 e 7.3). Dentro de cada parcela, o investigador mede 
a densidade de roedores (a variavel resposta) e a densidade de sementes e cobertura da vegeta^ao 
(as duas variaveis preditoras). Os dados sao organizados em uma planilha, na qual cada linha e uma 
parcela e as colunas sao as variaveis medidas dentro da parcela. 


ser corrigidos com uma transforma^ao da variavel preditora (ver Capitulo 
8), mas ressaltamos que as analises nao podem salvar um delineamento 
amostral ruim. 

Regressao multipla A extensao para regressao multipla e simples. Duas ou 
mais variaveis preditoras continuas sao medidas em cada replica, junto com 
uma unica variavel resposta. Retornando ao exemplo dos roedores do deserto, 
voce suspeita que, alem da disponibilidade de sementes, a densidade de roe¬ 
dores tambem seja controlada pela estrutura da vegeta^ao - em parcelas com 
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(A) 



I 


(B) 



Variavel X 

Figura 7.2 A amostragem inadequada sobre uma amplitude restrita da variavel X pode criar 
uma indina^ao de regressao falsamente nao significativa, mesmo que oXeoY sejam fortemente 
correladonadas uma com a outra. Cada ponto representa uma replica na qual urn valor foi medido 
para as variaveis XeY. Ci'rculos verdes representam possi'veis dados que nao foram coletados para 
a analise. Circulos pretos representam as amostras das replicas que foram medidas. (A) A amplitude 
total dos dados. A linha solida indica a rela^ao linear verdadeira entre as variaveis. (B) A linha de 
regressao e ajustada aos dados amostrados. Como a variavel X foi amostrada em uma amplitude 
restrita de valores, a altera^ao na variavel Y resultante e limitada, e a inclina^ao da regressao ajus¬ 
tada aparenta ser proxima de zero. Amostrar ao longo da amplitude total da variavel Xira prevenir 
essetipodeerro. 


vegeta^ao esparsa, os roedores do deserto sao vulneraveis a aves predadoras 
(Abramsky et al., 1997). Neste caso, voce poderia tomar tres medidas em cada 
parcela: densidade de roedores, densidade de sementes e cobertura de vegetaqio. 
A primeira ainda e a variavel resposta, as demais sao as duas variaveis preditoras 
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Figura 7.3 Falhas em amostrar uniformemente a amplitude total da variavel podem levar a re- 
sultados falsos. Como na Figura 7.2, cada ponto preto representa uma observagao registrada; os 
pontos verdes representam pares X, Y nao observados. (A) A linha solida indica a rela^ao linear 
verdadeira entre as variaveis. Essa rela^ao teria sido revelada se a variavel X tivesse sido amostrada 
uniformemente. (B) A linha de regressao e ajustada so aos dados amostrados (i. e., apenas os pontos 
pretos). Como apenas urn unico dado com urn valor alto de X foi medido, esse ponto teve uma in¬ 
fluence excessiva sobre a linha de regressao ajustada. 0 resultado sugere, de forma inacurada, uma 
rela^ao positiva entre as duas variaveis. 


(Figura 7.1). Idealmente, as diferentes variaveis preditoras devem ser indepen- 
dentes uma da outra. Como em delineamentos de regressao simples, os valores 
diferentes das variaveis preditoras devem ser estabelecidos de maneira uniforme 
ao longo de toda a amplitude de valores possfveis. Isto e simples em um estu- 
do experimental, mas raras vezes e possivel em um estudo observacional. Nesse 
caso, e frequente a situa^ao em que as variaveis preditoras serao correlacionadas 
entre si. Por exemplo, parcelas com alta densidade de vegeta^ao provavelmen- 
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te terao alta densidade de sementes. Pode haver poucas, ou nenhuma, parcelas 
onde a densidade da vegeta^ao seja alta e a de sementes, baixa (ou vice-versa). 
Essa co-linearidade torna dificil estimar, com acuracia, os parametros da regres¬ 
sao' e separar quanto da varia<;ao na variavel resposta realmente esta associada 
com cada uma das variaveis preditoras. 

Como sempre, a replica^ao se torna importante ao passo que adicionamos 
mais variaveis preditoras na analise. Seguindo a Regra dos 10 (ver Capitulo 6), 
voce deve tentar obter pelo menos 10 replicas para cada variavel preditora em 
seu estudo. Entretanto, em muitos casos, e muito mais facil medir variaveis 
preditoras adicionais que obter replicas independentes adicionais. No entanto, 
voce deve resistir a tentanao de medir tudo simplesmente porque e possivel. 
Tente selecionar variaveis que sao biologicamente importantes e relevantes 
para a hipotese ou a questao que voce esta tratando. E um erro pensar que um 
algoritmo de sele^ao de modelos, como uma regressao nniltipla gradativa, pode 
identificar com seguran<;a o conjunto de variaveis preditoras “correto” a partir 
de um grande conjunto de dados (Burnham & Anderson, 2002). Alem disso, 
grandes conjuntos de dados frequentemente sofrem de multicolinearidade: 
muitas das variaveis preditoras sao correlacionadas umas as outras (Graham, 
2003). 

Delineamentos de ANOVA 

Se a sua variavel preditora e categorica (ordenada ou nao ordenada) e sua variavel 
resposta e continua, seu delineamento e chamado de ANOVA (do ingles ANalysis 
Of VAriance). A ANOVA tambem se refere as analises estatisticas desses tipos de 
delineamentos (ver Capitulo 10). 

Terminologia A ANOVA e repleta de terminologias. Tratamentos se referem 
as diferentes categorias das variaveis preditoras usadas. Em um estudo experi¬ 
mental, os tratamentos representam as diferentes manipulates realizadas. Em 
um estudo observacional, os tratamentos representam os diferentes grupos sob 
comparanao. O numero de tratamentos em um estudo e igual ao de categorias 
sob compara^ao. Dentro de cada tratamento, observances multiplas serao fei- 
tas e cada uma e chamada de replica. Em delineamentos de ANOVA padrao, 
cada replica deve ser independente, tanto estatistica quanto biologicamente, 
das outras replicas dentro e entre os tratamentos. Mais adiante, neste capitulo, 
discutiremos certos delineamentos de ANOVA que atenuam o pressuposto de 
independence entre replicas. 


3 De fato, se uma das variaveis preditoras pode ser descrita como uma fun^ao linear perfeita da outra, 
sequer sera possivel encontrar algebricamente os coeficientes da regressao. Mesmo quando o pro- 
blema nao e tao grave, as correlates entre variaveis preditoras tornam dificil o teste e a compara^ao 
de modelos. Ver MacNally (2000b) para uma discussao de variaveis correlacionadas e constru^ao de 
modelos em biologia da conserva^ao. 




190 Nicholas J. Gotelli e Aaron M. Ellison 


Tambem fazemos uma distin^ao entre delineamentos com um fator e de- 
lineamentos multifatoriais. No primeiro caso, cada um dos tratamentos re- 
presenta a varia^ao em uma unica variavel preditora ou fator. Cada valor do 
fator que representa um tratamento em particular e chamado de nivel do tra- 
tamento. Por exemplo, um delineamento de ANOVA com um fator poderia ser 
utilizado para comparar as respostas do crescimento de plantas cultivadas em 

4 niveis diferentes de nitrogenio, ou as respostas de crescimento de 5 especies 
de plantas diferentes a um unico nivel de nitrogenio. Os grupos de tratamentos 
podem ser ordenados (p. ex., 4 niveis de nitrogenio) ou nao ordenados (p. ex., 

5 especies de plantas). 

No segundo tipo de delineamento, os tratamentos envolvem dois (ou mais) 
fatores diferentes e cada um e aplicado em combina^ao a diversos tratamen¬ 
tos. Em um delineamento multifatorial, existem diferentes niveis de tratamento 
para cada fator. Como no primeiro, neste caso, os tratamentos dentro de cada 
fator tambem podem ser ordenados ou nao ordenados. Por exemplo, um de¬ 
lineamento de ANOVA de dois fatores poderia ser necessario se voce quisesse 
comparar as respostas de plantas a 4 niveis de nitrogenio (Fator 1) e a 4 niveis 
de fosforo (Fator 2). Nesse delineamento cada um dos 4x4= 16 niveis dos 
tratamentos representa uma combina^ao diferente de nivel de nitrogenio e de 
fosforo. Cada combina^ao de nutrientes e aplicada a todas as replicas dentro do 
tratamento (Figura 7.4). 

Retornaremos a esse topico mais adiante, porem vale a pena perguntar, aqui, 
qual a vantagem de usar um delineamento de dois fatores. Por que simplesmen- 
te nao fazer dois experimentos separados? Por exemplo, voce poderia testar os 
efeitos de fosforo em um delineamento de ANOVA de um fator com 4 niveis de 
tratamento e testar os efeitos de nitrogenio em um delineamento separado de 
ANOVA de um fator tambem com 4 niveis de tratamento. Qual a vantagem de 
usar um delineamento de dois fatores com 16 combina«;6es de tratamentos de 
fosforo-nitrogenio em um unico experimento? 

Uma vantagem do delineamento de dois fatores e a eficiencia. E provavel que 
tenha maior custo-beneficio fazendo apenas um experimento - mesmo com 16 
tratamentos - do que ao fazer dois experimentos separados com 4 tratamentos 
cada. Uma vantagem mais importante e que delineamentos de dois fatores permi- 
tem testar tanto os efeitos principais (p. ex., os efeitos de nitrogenio e do fosforo 
sobre o crescimento das plantas) quanto os de intera^ao (p. ex., intera^oes entre 
nitrogenio e fosforo). 

Os efeitos principais sao os aditivos de cada nivel de um tratamento, usando 
a media dos niveis do outro tratamento. Por exemplo, o efeito aditivo de nitro¬ 
genio deve representar a resposta das plantas em cada nivel de nitrogenio, pela 
media das respostas aos niveis de fosforo. Ao contrario, o efeito aditivo do fosforo 
poderia ser medido como a resposta das plantas em cada nivel de fosforo, pela 
media das respostas aos diferentes niveis de nitrogenio. 

Os efeitos de intera^ao representam respostas unicas a combina^oes de tra¬ 
tamentos especificas que nao podem ser previstas simplesmente conhecendo os 
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Tratamento de nitrogenio (esquema com um fator) 

0,00 mg 

0,10 mg 

0,50 mg 

1,00 mg 

10 

10 

10 

10 


Tratamento de fosforo 

esquema com um fator) 

0,00 mg 

0,05 mg 

0,10 mg 

0,25 mg 

10 

10 

10 

10 


(Tratamentos simultaneos deNe 

P em um esquema de dois fatores) 

Tratamento de nitrogenio 

0,00 mg 

0,10 mg 

0,50 mg 

1,00 mg 

Tratamento 
de fosforo 

0,00 mg 

10 

10 

10 

10 

0,05 mg 

10 

10 

10 

10 

0,10 mg 

10 

10 

10 

10 

0,25 mg 

10 

10 

10 

10 


Figura 7.4 Combina0es de tratamentos em delineamentos de um fator (os dois paineis su¬ 
periors) e em um delineamento de dois fatores (painel inferior). Em todos os delineamentos, 
o numero em cada celula indica o numero de replicas independentes a serem realizadas. Nos 
dois delineamentos de um fator (esquemas de uma via), os quatro niveis do tratamento repre- 
sentam quatro concentrates diferentes de nitrogenio e fosforo (mg/L). 0 tamanho amostral 
total e de 40 parcelas em cada experimento com um fator. No delineamento de dois fatores, os 
4x4 = 16 tratamentos representam diferentes combina<;6es de concentrates de nitrogenio e 
fosforo que sao aplicadas de maneira simultanea em uma replica. Esse delineamento de ANOVA 
completamente cruzado com 10 replicas por combinato de tratamento requer um tamanho 
amostral total de 160 parcelas. Ver Figuras 7.9 e 7.10 para outros exemplos de delineamentos de 
dois fatores cruzados. 


efeitos principals. Por exemplo, o crescimento de plantas em tratamento com 
muito nitrogenio e muito fosforo poderia ser sinergicamente maior do que voce 
poderia prever conhecendo apenas os efeitos aditivos do nitrogenio e do fosforo 
em altos niveis. Os efeitos de intera^ao frequentemente sao a razao mais impor- 
tante para usar um delineamento fatorial. Fortes intera^oes sao a for<;a-guia por 
tras de muitas mudan<;as ecologicas e evolutivas, e com frequencia sao mais im- 
portantes que os efeitos principals. O Capitulo 10 discutira metodos analiticos e 
termos de interato em mais detalhes. 

Anova de um fator A ANOVA de um fator e um dos mais simples, porem 
robustos, delineamentos experimentais. Depois de descrever a estrutura de um 
fator basico, tambem explicaremos os delineamentos de blocos aleatorizados e 
de ANOVA aninhada. Estritamente falando, blocos aleatorizados e de ANOVA 
aninhada sao delineamentos de dois fatores, mas o segundo fator (blocos, ou 
subamostras) e incluido apenas para controlar a varia^ao amostral e nao e de 
interesse primario. 

O esquema de um fator e usado para comparar medias entre dois ou mais 
tratamentos ou grupos. Por exemplo, suponha que voce queira determinar se o 
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Numero ID: 1 
Tratamento: Granito 
Numero de cracas: 12 



Numero ID: 3 
Tratamento: Cimento 
Numero de cracas: 3 


Numero ID: 8 
Tratamento: Ardosia 
Numero de cracas: 11 


Numero ID 

Tratamento 

Replica 

Numero de cracas 

1 

Granito 

1 

12 

2 

Ardosia 

1 

10 

3 

Cimento 
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Granito 

2 

14 
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Ardosia 
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10 

6 

Cimento 

2 

8 

7 

Granito 

3 

11 

8 

Ardosia 
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11 

9 

Cimento 

3 
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30 

Cimento 

10 
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Figura 7.5 Exemplo de esquema de um fator. Tal experimento e delineado para testar o efeito 
do tipo de substrato sobre o recrutamento de cracas na zona intertidal rochosa (Caffey, 1982). 
Cada ci'rculo representa um substrato rochoso independente. Existem 10 replicas aleatoriamente 
distribui'das de cada um de tres tratamentos, representados pelos tres tons de verde. 0 numero de 
cracas recrutadas e amostrado em um quadrado de 10 cm no centra de cada superficie rochosa. 
Os dados sao organizados em uma planilha, na qual cada linha e uma replica independente. As 
colunas indicam o numero ID de cada replica (1-30), o grupo de tratamento (cimento, ardosia ou 
granito), o numero da replica dentro de cada tratamento (1-10) e o numero de cracas (a variavel 
resposta). 


recrutamento de cracas na zona intertidal em uma linha costeira e afetado pelos 
diferentes tipos de substratos rochosos (Caffey, 1982). Voce pode come^ar obten- 
do um conj unto de ladrilhos de ardosia, granito e cimento. Os ladrilhos devem ser 
identicos em tamanho e forma, e diferir apenas quanto ao material. Seguindo a 
Regra dos 10 (Capitulo 6), estabele^a 10 replicas de cada tipo de substrato (N = 30 
total). Cada replica e colocada na zona intertidal intermediary, em um conjunto 
de coordenadas espaciais que foram escolhidas com um gerador de numeros alea- 
torios (Figura 7.5). 























Princi'pios de Estati'stica em Ecologia 193 


Depois de montar o experimento, voce retorna apos 10 dias e conta o nu- 
mero de cracas dentro de um quadrado de 10 cm X 10 cm centralizado em cada 
ladrilho. Os dados sao organizados em uma planilha, na qual cada linha corres- 
ponde a uma replica. As primeiras colunas contem informa^oes de identifica^ao 
associadas com cada replica, e a ultima coluna da planilha fornece o numero 
de cracas no quadrado. Embora os detalhes sejam diferentes, esse e o mesmo 
esquema usado no estudo de densidade de formigas (descrito no Capitulo 5): 
muitas replicas de observa<;6es independentes sao obtidas para cada tratamento 
ou grupo amostral. 

O esquema de um fator e um dos mais simples, embora dos mais podero- 
sos, delineamentos experimentais, podendo ser facilmente adaptado para estu- 
dos em que o numero de replicas por tratamento nao seja identico (tamanhos 
amostrais desiguais). O esquema de um fator permite-nos testar as diferen<;as 
entre os tratamentos, bem como hipoteses mais especificas acerca de quais me- 
dias de tratamentos em particular sao diferentes ou similares (ver“Comparando 
Medias” no Capitulo 10). 

A principal desvantagem do esquema de um fator e que ele nao acomoda 
explicitamente a heterogeneidade ambiental. A aleatoriza^ao completa das re¬ 
plicas dentro de cada tratamento sugere que elas amostrarao todo o conjunto 
de condi^oes possiveis, dentre as quais podem afetar a variavel resposta. Por um 
lado, isso e positivo, pois significa que os resultados do experimento podem ser 
generalizados para todos esses ambientes. Por outro lado, se o “ruido” ambiental 
for muito mais forte que o “sinal” do tratamento, o experimento tera um baixo 
poder; a analise pode nao revelar diferen<;as entre tratamentos, a menos que 
existam muitas replicas. Outros delineamentos, incluindo o esquema de blocos 
aleatorizados e o de dois fatores, podem ser usados para acomodar a variabili- 
dade ambiental. 

Uma segunda, e mais sutil, desvantagem do esquema de um fator e que ele 
organiza os grupos de tratamentos ao longo de um unico fator. Se os tratamentos 
representam diferentes tipos de fatores, entao um esquema de dois fatores deve 
ser usado para separar os efeitos principals e os termos de intera^ao. Termos de 
intera^ao sao especialmente importantes, porque o efeito de um fator com fre- 
quencia depende dos niveis de outro. Por exemplo, o padrao de recrutamento 
em diferentes substratos pode depender dos niveis de um segundo fator (como a 
densidade de predadores). 

Delineamentos de blocos aleatorizados Uma forma eficiente de incorporar a 
heterogeneidade ambiental e modificar a ANOVA de um fator e usar um delinea- 
mento de blocos aleatorizados. Um bloco e uma area delimitada ou um periodo 
de tempo dentro do qual as condi^oes ambientais sao relativamente homogeneas. 
Os blocos podem ser distribuidos aleatoria ou sistematicamente na area de estu¬ 
do, mas eles devem ser arranjados de forma que as condi^oes ambientais sejam 
mais similares dentro dos blocos que entre eles. 

Uma vez que os blocos estejam estabelecidos, as replicas ainda terao que ser 
atribuidas de maneira aleatoria aos tratamentos, mas ha uma restri<;ao nisso: que 
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uma unica replica de cada um dos tratamentos seja atribuida a cada bloco. Assim, 
em um delineamento de blocos aleatorizados simples, cada um contem exatamen- 
te uma replica de todos os tratamentos do experimento. Dentro de cada bloco, a 
localiza^ao das replicas dos tratamentos deve ser aleatorizada. A Figura 7.6 ilustra 
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Figura 7.6 Exemplo de um delineamento de blocos aleatorizados. As 10 replicas de cada um dos 
tres tratamentos sao agrupadas em blocos - agrupamentos fisicos com uma replica de cada um dos 
tres tratamentos. Tanto a posi^ao dos blocos quanto a dos tratamentos dentro dos blocos sao aleato- 
rizadas. A organiza^ao dos dados na planilha e identica a do esquema de um fator (Figura 7.5), mas a 
coluna de replicas e substitui'da por outra, indicando o bloco ao qual cada replica esta associada. 
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o experimento das cracas como um delineamento de blocos aleatorizados. Como 
ha 10 replicas e 10 blocos (menos, se voce replicar dentro de cada bloco) cada um 
contera uma replica de cada um dos tres tratamentos. O esquema da planilha para 
esses dados e o mesmo que para o esquema de um fator, exceto com rela^ao a co- 
luna de replicas, que agora e substituida por outra indicando o bloco. 

Cada bloco deve ser pequeno o suficiente para abranger um conjunto de 
condi<;6es relativamente homogeneas. No entanto, cada um deve ser grande o 
suficiente para acomodar uma replica de cada tratamento. Alem disso, deve ha¬ 
ver espa^o dentro do bloco para um espa^amento entre as replicas e a garantia 
de sua independence (ver Figura 6.5). Os proprios blocos tambem devem estar 
distantes um do outro o suficiente para garantir a independence das replicas 
entre eles. 

Se existirem gradientes geograficos nas concludes ambientais, entao cada 
bloco deve abranger um pequeno intervalo do gradiente. Por exemplo, exis- 
tem fortes gradientes ambientais ao longo da encosta de uma montanha. Desse 
modo, podemos estabelecer um experimento com tres blocos, cada um em uma 
altitude - baixa, media e alta (Figura 7.7A). Porem, nao seria apropriado criar 
tres blocos no mesmo sentido do gradiente - da maior altitude para a mais baixa 
(Figura 7.7B)-, cada bloco englobaria condi^oes muito heterogeneas. Em outros 
casos, a varia^ao ambiental pode ocorrer em manchas, e os blocos devem ser 
arranjados de forma a refleti-las. Por exemplo, se um experimento for condu- 
zido em um complexo de areas alagadas, cada charco semi-isolado poderia ser 
tratado como um bloco. Por fun, se a organiza^ao espacial da heterogeneidade 
ambiental for desconhecida, os blocos podem ser arranjados de maneira aleato- 
ria dentro da area de estudo. 1 

O delineamento de blocos aleatorizados e um modo eficiente e bastante flexi- 
vel que fornece um controle simples para a heterogeneidade ambiental. Ele pode 
ser usado para controlar gradientes ambientais e manchas de habitat. Como vere- 
mos no Capitulo 10, quando houver heterogeneidade ambiental presente, o deli¬ 
neamento de blocos aleatorizados e mais eficiente que um esquema de um fator 
completamente aleatorizado, que pode requerer muito mais replica^ao para obter 
o mesmo poder estatistico. 

O delineamento de blocos aleatorizados e tambem util quando sua re- 
plica<;ao e restringida por espa^o ou tempo. Por exemplo, suponha que voce 


4 O delineamento de blocos aleatorizados permite que voce estabele^a seus blocos para abranger 
gradientes ambientais em uma unica dimensao espacial. Mas e se a varia^ao ocorre em duas di- 
mensoes? Por exemplo, suponha que existe um gradiente de umidade do Norte para o Sul em um 
campo, mas tambem exista um gradiente do Leste para o Oeste na densidade de predadores. Em 
tais casos, delineamentos de blocos aleatorizados mais complexos podem ser usados. Por exemplo, 
o quadrado latino e um delineamento de blocos em que os n tratamentos sao colocados no campo 
em um quadrado nxn; cada tratamento aparece exatamente uma vez em todas as linhas e uma vez 
em todas as colunas do esquema. Sir Ronald Fisher (ver Nota de Rodape 5, Capitulo 5) foi pioneiro 
nesses tipos de delineamentos para estudos de agronomia, nos quais um unico campo e dividido 
e os tratamentos aplicados as subparcelas contiguas. Esses delineamentos nao tern sido utilizados 
com frequencia por ecologos, por que restri^oes de aleatoriza^oes e de esquematiza<;ao sao dificeis 
de obter em experimentos de campo. 
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(A) Blocos validos (B) Blocos invalidos 

Maior altitude 


Menor altitude 


Figure 7.7 Delineamentos de bloco validos e invalidos. (A) Tres blocos devidamente orienta- 
dos, cada um englobando a mesma eleva^ao em uma encosta de montanha ou outro gradiente 
ambiental qualquer. As condi^oes ambientais sao mais similares dentro do que entre blocos. (B) 
Esses blocos sao orientados indevidamente, indo"no sentido"do gradiente de altitude. Condi0es 
sao tao heterogeneas dentro dos blocos quanto entre eles, entao nenhuma vantagem e obtida 
em seu uso. 


esta fazendo um experimento de laboratorio sobre crescimento de algas com 
8 tratamentos e quer completar 10 replicas por tratamento. No entanto, voce 
tern espa^o suficiente em seu laboratorio para fazer apenas 12 replicas por vez. 
Como proceder? Voce deve fazer o experimento em “blocos”, montando uma 
unica replica de cada um dos 8 tratamentos. Apos registrar os resultados, mon¬ 
te o experimento de novo (incluindo outro conjunto de aleatoriza^oes para o 
estabelecimento e posicionamento dos tratamentos) e continue ate acumular 
10 blocos. Esse delineamento controla as mudan^as inevitaveis nas condi<;6es 
ambientais que ocorrem em seu laboratorio, ao longo do tempo, e ainda permite 
compara<;6es apropriadas dos tratamentos. Em outros casos, a limita«;ao pode 
nao ser de espa^o, mas de organismos. Por exemplo, em um estudo sobre o aca- 
salamento de peixes, voce pode ter que esperar ate que tenha um certo numero 
de peixes sexualmente maduros antes de montar e executar um unico bloco do 
experimento. Em ambos os exemplos, o delineamento de blocos aleatorizados e 
a melhor precau^ao contra a varia^ao nas condi^oes durante o decorrer de seu 
experimento. 

Por fim, o delineamento de blocos aleatorizados pode ser adaptado para um 
esquema de pares casados. Cada bloco consiste em um grupo de organismos 
individuals ou de parcelas que foram deliberadamente escolhidas para terem as 
caracteristicas mais similares possiveis. Cada replica no grupo recebe a atribui<;ao 
de um dos tratamentos. Por exemplo, em um simples estudo experimental dos 
efeitos da abrasao sobre o crescimento de corais, um par de cabe^as de corais 
com tamanhos similares poderia ser considerado um linico bloco. Uma das ca- 
be^as de coral poderia ser aleatoriamente atribuida ao grupo controle e a outra, 
ao grupo de abrasao. Outro par casado poderia ser escolhido da mesma forma 
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e os tratamentos aplicados. Mesmo os individuos em cada par nao sendo parte 
de um bloco espacial ou temporal, eles provavelmente serao mais similares que 
individuos em qualquer outro bloco, pois foram casados com base no tamanho 
da colonia ou em outras caracteristicas. Por essa razao, a analise utilizara um de- 
lineamento de blocos aleatorizados. A abordagem de pares casados e um metodo 
muito eficiente quando as respostas das replicas sao muito heterogeneas. Parear 
os individuos controla essa heterogeneidade, tornando mais facil detectar os efei- 
tos do tratamento. 

Existem quatro desvantagens para o delineamento de blocos aleatorizados. 
Na primeira, existe um custo estatistico para fazer o experimento com blocos. 
Se o tamanho amostral for pequeno e o efeito do bloco fraco, o delineamento 
de blocos aleatorizados e menos robusto que um esquema de um fator (ver 
Capitulo 10). A segunda desvantagem e que, se blocos forem muito peque- 
nos, voce pode introduzir falta de independence ao aglomerar fisicamente os 
tratamentos. Como discutimos no Capitulo 6, aleatorizar a posi^ao dos trata¬ 
mentos dentro do bloco ajudara com tal problema, mas nao o eliminara in- 
teiramente. A terceira desvantagem do delineamento de blocos aleatorizados 
e que, se uma das replicas for perdida, os dados daquele bloco nao podem ser 
usados, a menos que os valores nao disponiveis possam ser estimados de ma- 
neira indireta. 

A quarta - e mais seria - desvantagem do delineamento de blocos aleatoriza¬ 
dos e que ele assume que nao ha intera«;ao entre blocos e tratamentos. O delinea¬ 
mento de blocos leva em conta as diferen^as aditivas na variavel resposta e assume 
que a ordem do ranque das respostas ao tratamento nao muda de um bloco para 
o proximo. Voltando para o exemplo das cracas, o modelo de blocos aleatorizados 
assume que se o recrutamento em um dos blocos for alto, todas as observances 
naquele bloco serao assim. No entanto, assume-se que os efeitos do tratamento 
sejam consistentes de um bloco para o proximo, de forma que a ordem do ranque 
no recrutamento de cracas entre tratamentos (granito > ardosia > cimento) seja a 
mesma, independente de quaisquer diferen<^as nos niveis gerais de recrutamento 
entre blocos. Mas suponhamos que em alguns blocos o recrutamento seja maior 
nos substratos de cimento e em outros, nos de granito. Neste caso, o delinea¬ 
mento de blocos aleatorizados pode falhar em caracterizar de maneira adequada 
os efeitos principals do tratamento. Por essa razao, alguns autores (Mead, 1988, 
Underwood, 1997) tern argumentado que o simples delineamento de blocos ale¬ 
atorizados nao deve ser usado, a menos que exista replica^ao dentro dos blocos. 
Assim, o delineamento se torna uma analise de variancia de dois fatores, que dis- 
cutiremos a seguir. 

A replica^ao dentro de blocos de fato ira separar os efeitos principals, os 
efeitos dos blocos e a intera^ao entre blocos e tratamentos. A replica^ao tam- 
bem ira tratar o problema de dados faltantes ou perdidos dentro de um bloco. 
No entanto, os ecologos frequentemente nao tern o luxo de replica<;ao dentro 
de blocos, em especial quando o fator do bloco nao e de interesse primario. O 
delineamento de blocos aleatorizados simples (sem replica^ao) ira, no minimo, 
captar o componente aditivo (em geral o componente mais importante) de va- 



198 Nicholas J. Gotelli e Aaron M. Ellison 


ria^ao ambiental que poderia, de outro modo, ser aglomerado ao erro puro em 
um esquema de um fator. 

Delineamentos aninhados Um delineamento aninhado se refere a qualquer 
delineamento em que ha subamostragem dentro de cada uma das replicas. Con- 
forme o exemplo das cracas, suponha que, em vez de medir o recrutamento 
para uma replica em um unico quadrado de 10 x 10 cm, voce decidiu fazer tres 
dessas medidas em cada um dos 30 ladrilhos do estudo (Figura 7.8). Embora o 



Numero ID 

Tratamento 

Numero 
da replica 

Subamostra 

Numero de cracas 

1 

Granito 

1 

1 

12 

2 

Granito 

1 

2 

10 

3 

Granito 

1 

3 

11 

4 

Ardosia 

2 

1 

14 

5 

Ardosia 

2 

2 

10 

6 

Ardosia 

2 

3 

7 

7 

Cimento 

3 

1 

5 

8 

Cimento 

3 

2 

6 

9 

Cimento 

3 

3 

10 





. 




. 

. 

90 

Cimento 

30 

3 

6 


Figura 7.8 Exemplo de um delineamento aninhado. 0 estudo e o mesmo mostrado nas Figuras 
7.5 e 7.6.0 esquema e identico ao de um fator da Figura 7.5, mas neste caso tres subamostras sao 
realizadas em cada replica independente. Na planilha, uma coluna extra e adicionada para indicar o 
numero da subamostra, e o total de observances aumentou de 30 para 90. 
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numero de replicas nao tenha aumentado, o de observa^oes aumentou de 30 
para 90. Agora, cada linha na planilha desses dados representa uma subamostra 
diferente e as colunas indicam de qual replica e de qual tratamento a subamostra 
foi retirada. 

Este e o primeiro delineamento no qual incluimos subamostras que clara- 
mente nao sao independentes umas das outras. Qual e a logica para tal esquema 
amostral? A razao principal e aumentar a precisao com que estimamos a resposta 
para cada replica. Por causa da Lei dos Grandes Numeros (Capitulo 3), quanto 
mais subamostras usarmos, mais precisamente estimaremos a media para cada 
replica. O aumento na precisao deve aumentar o poder do teste. 

Existem tres vantagens em usar um delineamento aninhado. A primeira e 
que a subamostragem aumenta a precisao da estimativa para cada replica no de¬ 
lineamento. Na segunda, o delineamento aninhado permite testar duas hipote- 
ses: primeira, existe varia^ao entre tratamentos? E, segunda, existe varia^ao entre 
as replicas dentro de um tratamento? A primeira hipotese e equivalente a um 
delineamento de um fator que usa as medias das subamostras como a observa- 
^ao para cada replica. A segunda hipotese e equivalente ao delineamento de um 
fator que usa as subamostras para testar por diferen^as entre replicas dentro dos 
tratamentos. 3 

Por fim, o delineamento aninhado pode ser estendido para um tipo amos¬ 
tral hierarquico. Por exemplo, voce poderia, em um unico estudo, fazer conta- 
gens em subamostras aninhadas dentro de replicas, replicas aninhadas dentro 
de zonas intertidais, zonas intertidais aninhadas dentro de costoes, costoes ani- 
nhados dentro de regioes, e ate mesmo regioes aninhadas dentro de continentes 
(Caffey, 1985). A razao para realizar esse tipo de amostragem e que podemos 
fazer a parti^ao da varia^ao nos dados em componentes que representam cada 
um dos niveis hierarquicos do estudo (ver Capitulo 10). Por exemplo, voce pode 
ser capaz de mostrar que 80% da varia^ao nos dados ocorrem ao nivel de zonas 
intertidais dentro de costoes, mas apenas 2% podem ser atribuidas a varia^ao 
entre costoes dentro de uma regiao. Isto pode significar que a densidade de cra- 
cas varia fortemente da zona intertidal alta para a baixa, mas nao varia muito de 
uma linha costeira para outra. Tais afirma^oes sao liteis para acessar a impor¬ 
tance relativa de diferentes mecanismos em produzir padroes (Petraitis, 1998; 
ver tambem , Figura 4.6). 

Os delineamentos aninhados sao potencialmente perigosos, ao passo que 
eles com frequence sao analisados de maneira incorreta. Um dos equivocos mais 
serios e comuns em ANOVA e os investigadores tratarem cada subamostra como 
uma replica independente e analisar o delineamento aninhado como o de um 


5 Voce pode pensar nesta segunda hipotese como um delineamento de um fator em um nivel hierar¬ 
quico inferior. Por exemplo, suponha que voce usou os dados apenas das quatro replicas do trata¬ 
mento de granito. Considere cada uma como um “tratamento” diferente e cada subamostra como 
uma “replica” diferente para aquele tratamento. O delineamento agora e de um fator que compara as 
replicas do tratamento de granito. 
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fator (Hurlbert, 1984). A falta de independence das subamostras aumenta artifi- 
cialmente o tamanho amostral (o triplo em nosso exemplo, no qual tiramos tres 
subamostras em cada ladrilho) e infla a probabilidade de um erro estatistico do 
Tipo I (i. e., erroneamente rejeitar uma hipotese nula verdadeira). Um segundo 
e menos serio problema e que o delineamento aninhado pode ser dificil ou ate 
impossivel de analisar de maneira adequada se o tamanho amostral nao for o 
mesmo em cada grupo. Mesmo com um numero identico de amostras e de su¬ 
bamostras, a amostragem aninhada em esquemas mais complexos, como o de 
dois fatores ou o delineamento parcelas subdivididas, pode ser complicado para 
analisar. As configurates padrao dos programas estatisticos em geral nao sao 
apropriadas. 

Contudo, a desvantagem mais grave do delineamento aninhado e que ele fre- 
quentemente representa um caso de raa aloca^ao do esfor 90 amostral. Como ve- 
remos no Capitulo 10, o poder dos delineamentos de ANOVA dependem muito 
mais do numero de replicas independentes do que da precisao com a qual cada 
replica e medida. E uma estrategia muito melhor investir seu esfor^o amostral 
em obter mais replicas independentes que subamostrar dentro de cada replica. 
Especificando com cuidado seu protocolo de amostragem (p. ex., “apenas frutos 
nao danificados de plantas nao aglomeradas crescendo sob sombreamento com- 
pleto”), voce pode ser capaz de aumentar a precisao de suas estimativas com mais 
eficiencia que com repetidas subamostragens. 

Dito isto, voce certamente deve continuar a subamostrar, caso seja rapido e 
barato. No entanto, nosso conselho e que voce tire a media (ou junte) dessas su¬ 
bamostras, de forma que voce tenha uma unica observa^ao para cada replica e, 
em seguida, trate o experimento como um delineamento de um fator. Uma vez 
que os numeros nao sejam muito oscilantes, tirar a media pode tambem aliviar 
problemas de tamanhos amostrais desiguais entre subamostras, alem de melhorar 
o ajuste dos erros a uma distribui<;ao normal. £ possivel, porem, que, apos tirar 
a media entre subamostras dentro das replicas, voce nao tenha mais replicas o 
suficiente para uma analise completa. Neste caso, e necessario um delineamento 
com mais replicas que sejam verdadeiramente independentes. Subamostrar nao e 
solu^ao para uma replica^ao inadequada! 

Delineamentos multifatoriais: esquema de dois fatores Os delineamentos 
multifatoriais estendem os principios do esquema de um fator para dois ou mais 
fatores de tratamento. As questoes sobre aleatoriza^ao, esquemas e amostragem 
sao identicas aquelas discutidas para os delineamentos de um fator de blocos 
aleatorizados e aninhados. De fato, a unica diferen^a real no delineamento esta 
na atribu^ao dos tratamentos a dois ou mais fatores em vez de um unico fator. 
Como antes, os fatores podem representar tanto tratamentos ordenados quanto 
nao ordenados. 

Retornando ao exemplo das cracas, suponhamos que, alem do efeito do subs- 
trato, voce queria testar os efeitos de caramujos predadores sobre o recrutamen- 
to de cracas. Voce poderia estabelecer um segundo experimento de um fator em 
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quatro tratamentos: sem manipula^ao, gaiola controle, 6 exclusao do predador e 
inclusao do predador. No entanto, em vez de rodar dois experimentos separados, 
voce decide examinar ambos os fatores em um unico experimento. Isso nao e 
apenas um uso mais eficiente do seu tempo de campo, mas tambem o efeito dos 
predadores sobre o recrutamento de cracas pode ser diferente, dependendo do 
tipo de substrato. Portanto, voce estabelece tratamentos em que aplica, de forma 
simultanea, um substrato e um tratamento de preda<;ao diferentes. 

Este e um exemplo de delineamento fatorial, no qual dois ou mais fatores 
sao testados simultaneamente em um experimento. O elemento-chave de um de¬ 
lineamento fatorial adequado e que os tratamentos sao completamente cruzados 
e ortogonais: todo nivel de tratamento do primeiro fator (substrato) deve ser 
representado com todos os niveis do segundo fator (preda^ao; Figura 7.9). Assim, 
o experimento de dois fatores tern 3x4 = 12 combina 9 oes distintas de tratamen¬ 
tos, em oposi^ao a apenas 3 tratamentos para um experimento de um fator de 
substrato ou 4 tratamentos para um experimento de um fator de preda<;ao. Note 
que cada um desses experimentos de um fator ficaria restrito a apenas uma das 
combina^oes de tratamentos para o outro fator. Em outras palavras, o experimen¬ 
to de substrato que descrevemos anteriormente foi conduzido sem manipula^ao 
para o tratamento de preda^ao, o qual poderia ser conduzido em apenas um tipo 
de substrato. Uma vez que as combina 9 oes de tratamentos tenham sido deter- 
minadas, o estabelecimento fisico do experimento seria o mesmo que para um 
esquema de um fator com 12 combina 9 oes de tratamentos (Figura 7.10). 

No experimento de dois fatores, e critico que todas as combina 9 oes cruzadas 
de tratamentos estejam representadas no delineamento. Se alguma das combi- 
na 9 oes de tratamentos estiver faltando, teremos um delineamento confundido. 
Como exemplo extremo, suponha que montamos apenas os tratamentos subs¬ 
trato de granito-exclusao de predadores e o de substrato de ardosia-inclusao de 
predadores. Agora, o efeito do predador esta confundido com o do substrato. Se 
os resultados forem estatisticamente significantes ou nao, nao podemos separar 
quando o padrao e devido ao efeito do predador, ao efeito do substrato, ou a in- 
tera 9 ao entre eles. 

Tal exemplo ressalta uma diferen 9 a importante entre experimentos mani- 
pulativos e estudos observacionais. No estudo observacional, podemos coletar 
dados da varia 9 ao na abundancia de predadores e de presas a partir de uma gama 


6 Em uma gaiola-controle, os investigadores buscam simular as condi^oes fi- 
sicas geradas pela gaiola, mas ainda permitem que os organismos se movam 
livremente dentro e fora da parcela. Por exemplo, uma gaiola-controle pode 
consistir de um teto telado (colocada sobre uma parcela) que permita a en- 
trada de caramujos predadores pelos lados. Em um tratamento de exclusao, 
todos os predadores sao removidos de uma gaiola telada. No tratamento de 
inclusao, os predadores sao colocados dentro de cada gaiola telada. A figura 
ao lado ilustra uma gaiola (painel superior) e uma gaiola-controle (painel in¬ 
ferior) em um experimento de exclusao de peixes em um riacho venezuelano 
gaiola-controle (Flecker, 1996). 
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Tratamento de substrato (esquema de um fator) 

Granito 

Ardosia 

Cimento 

o 

o 

o’° 

o 

o 


Tratamento de preda^ao (esquema de um fator) 

Sem manipula^ao 

Controle 

Exclusao do predador 

Inclusao do predador 

10 

r l 10 

1 1 

1 1 


10 


10 


(Tratamentos simultaneos de 


predagao e de substrato em um 
esquema de dois fatores) 

Tratamento de substrato 

Granito 

Ardosia 

Cimento 

Tratamento 
de preda^ao 

Nao manipulado 

o 

o 

o’° 

o 

o 

Controle 

r —, 10 

!Oj 

r“i 10 

'A 1 

l Wj 

r—i 10 

lOl 

Exclusao de predador 

O 

10 

• 

10 

o 

10 

Inclusao de predador 

O 

10 

o 

10 

o 

10 


Figura 7.9 Combina^oes de tratamentos em dois delineamentos de um fator e em urn de 
dois fatores completamente cruzados. Este experimento e delineado para testar o efeito dos 
tipos de substratos (granito, ardosia ou cimento) e de preda^ao (sem manipula^ao, controle, 
exclusao do predador, inclusao do predador) sobre o recrutamento de cracas na zona intertidal 
rochosa. 0 numero 10 indica o total de replicas em cada tratamento. Os tres tons dos circulos 
representam os tres tratamentos de substratos e os padroes dos quadrados, os quatro trata¬ 
mentos de preda^ao. Os dois paineis superiores ilustram os dois delineamentos de um fator, em 
que apenas um dos dois fatores e variado sistematicamente. No de dois fatores (painel inferior), 
os 4 x 3 = 12 tratamentos representam diferentes combinagoes de substrato e preda^ao. 0 si'm- 
bolo em cada celula indica a combina^ao de tratamentos de preda^ao e substrato que foram 
aplicados. 


de amostras. Mas os predadores frequentemente estao restritos a apenas certos 
micro-habitats ou tipos de substratos, de forma que a presen^a ou ausencia do 
predador seja de fato naturalmente confundida com diferen^as nos tipos de 
substratos. Isto torna diflcil separar causa e efeito (ver Capitulo 6). O forte dos 
experimentos de campo multifatoriais e que eles desmembram essa co-varia^ao 
natural e revelam os efeitos de multiplos fatores separadamente e em conjunto. 
O fato de que algumas dessas combina^oes de tratamentos possam ser artificiais 
e raras vezes, se nao nunca, encontradas na natureza, na verdade e um dos po- 
tenciais do experimento: ele revela a contribui^ao independente de cada fator aos 
padroes observados. 

A principal vantagem dos delineamentos de dois fatores e a habilidade de 
separar efeitos principais e as intera^oes entre esses fatores. Como discutiremos 
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Numero ID: 1 

Tratamento de substrato: Granito 
Tratamento de preda^ao: Sem manipula<;ao 
Numero de cracas: 12 


Numero ID: 120 
Tratamento de substrato: Cimento 
Tratamento de preda<;ao: Inclusao 
Numero de cracas: 2 


Numero ID: 5 

Tratamento de substrato: Ardosia 
Tratamento de preda^ao: Controle 
Numero de cracas: 10 


Numero ID 

Tratamento 
de substrato 

Tratamento de 
preda^ao 

Numero de cracas 

1 

Granito 

Sem manipula^ao 

12 

2 

Ardosia 

Sem manipula^ao 

10 

3 

Cimento 

Sem manipulagao 

8 

4 

Granito 

Controle 

14 

5 

Ardosia 

Controle 

10 

6 

Cimento 

Controle 

8 

7 

Granito 

Exclusao de predador 

50 

8 

Ardosia 

Exclusao de predador 

68 

9 

Cimento 

Exclusao de predador 

39 



. 






120 

Cimento 

Inclusao de predador 

2 


Figura 7.10 Exemplo de urn delineamento de dois fatores. Os si'mbolos dos tratamentos sao 
dados na Figura 7.9. A planilha contem colunas para indicar qual tratamento de substrato e qual de 
predagao foram aplicados em cada replica. 0 delineamento inteiro inclui 4 x 3 x 10 = 120 replicas 
no total, mas apenas 36 replicas (tres por combinaqao de tratamentos) foram ilustradas. 


no Capitulo 10, o termo de intera^ao representa o componente nao aditivo da 
resposta. A intera^ao mede a extensao na qual as diferentes combina^oes de trata¬ 
mentos agem aditiva, sinergica ou antagonicamente. 

Talvez a principal desvantagem do delineamento de dois fatores seja que o 
numero de combina^oes de tratamentos pode; com rapidez, tornar-se muito 
grande para uma replica^ao adequada. No exemplo de preda^ao das cracas, 
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120 replicas seriam necessarias para replicar 10 vezes cada combina^o de tra- 
tamento. 

Como no delineamento de um fator, um simples esquema de dois fatores nao 
leva em conta a heterogeneidade espacial. Isso pode ser tratado por um delinea¬ 
mento de blocos aleatorizados simples, no qual cada bloco contem exatamente 
uma das combina<;6es de tratamentos. Alternativamente, se voce replicar todos 
os tratamentos dentro de cada bloco, isto se tornaria um delineamento de tres 
fatores, com os blocos formando o terceiro fator na analise. 

Uma limitaqao final dos delineamentos de dois fatores e que pode nao ser 
possivel estabelecer todas as combina^oes ortogonais de tratamentos. E um 
tanto surpreendente que, para varios experimentos ecologicos corriqueiros, o 
conjunto total de combina^oes de tratamentos pode nao ser viavel ou logi- 
co. Por exemplo, suponha que voce esteja estudando os efeitos da competi^ao 
entre duas especies de salamandras sobre a taxa de sobrevivencia destes ani- 
mais. Voce decide usar um simples delineamento de dois fatores no qual cada 
especie representa um dos fatores. Dentro de cada um, os dois tratamentos 
sao a presen^a ou a ausencia da especie. Esse delineamento completamente 
cruzado produz quatro tratamentos (Tabela 7.2). Mas o que voce medira na 
combina^ao de tratamentos em que nao tenha nem a especie A nem a espe¬ 
cie B? Por defini^ao, nao ha nada para medir neste caso. Em vez disso, voce 
tera que estabelecer os outros tres tratamentos ([Especie A Presente, Especie 
B Ausente], [Especie A Ausente, Especie B Presente], [Especie A Presente, Es¬ 
pecie B Presente]) e analisar o delineamento como uma ANOVA de um fator. 
O delineamento de dois fatores seria possivel apenas se mudarmos a variavel 
resposta. Se a variavel resposta for a abundancia de presas comidas por sala¬ 
mandras, em vez da sobrevivencia das salamandras, podemos entao estabelecer 
o tratamento sem salamandras e medir os niveis de presa no esquema de dois 


TABELA 7.2 Combina^ao de tratamentos em um esquema 
de dois fatores para experimentos com a 
simples adic;ao ou remo<;ao de especies 


Especie A 

Especie B 

Ausente 

Presente 

Ausente 

10 

10 

Presente 

10 

10 


O valor em cada celula e o numero de replicas de cada combina^ao de tratamentos. Se a variavel resposta 
for alguma propriedade da propria especie (p. ex., sobrevivencia, taxa de crescimento), entao a combi- 
na<;ao Especie A Ausente-Especie B Ausente (na caixa) logicamente nao e possivel, e a analise tera que 
usar um esquema de um fator com tres grupos de tratamentos (Especie A Presente-Especie B Presente, 
Especie A Presente-Especie B Ausente e Especie A Ausente-Especie B Presente). Se a variavel resposta for 
alguma propriedade do ambiente que potencialmente seja afetada pelas especies (p. ex., abundancia de 
presas, pH), entao as quatro combina^oes de tratamentos podem ser usadas e analisadas conforme uma 
ANOVA com dois fatores ortogonais (Especie A e Especie B), cada uma com dois niveis de tratamento 
(Ausente, Presente). 
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fatores completamente cruzados. Certamente, agora esse experimento faz uma 
pergunta bastante diferente. 

Os experimentos de competi^ao entre duas especies, como nosso exemplo das 
salamandras, tem uma longa historia na pesquisa ecologica e ambiental (Gold¬ 
berg & Scheiner, 2001). Um numero de problemas sutis surge no delineamento e 
na analise de experimentos de competi^ao entre duas especies. Esses experimen¬ 
tos tentam distinguir entre uma especie focal, para a qual a variavel resposta e me- 
dida, uma especie associativa, cuja densidade e manipulada, e especies nao focais, 
que podem estar presentes, mas nao sao manipuladas experimentalmente. 

A primeira questao e qual tipo de delineamento utilizar: aditivo, substitutivo 
ou superficie de resposta (Figura 7.11; Silvertown, 1987). Em um delineamento 
aditivo, a densidade da especie focal e mantida constante enquanto a densidade 
da especie experimental e variada. No entanto, esse delineamento confunde os 
efeitos de densidade e de frequencia. Por exemplo, se compararmos uma parcela 


Delineamento Delineamento 



Numero de indivi'duos da Especie A 


Figura 7.11 Delineamentos experimentais para experimentos de competigao. A abundancia de 
cada uma das Especies A e B e estabelecida em 0,1,2, ou 4 indivi'duos. Cada X indica uma combina- 
$ao de tratamentos diferentes. Em um delineamento aditivo, a abundancia de uma especie e fixa (2 
individuosda Especie A) e a abundancia do competidor varia (0,1,2, ou 4 indivi'duos da Especie B). 
Em um delineamento substitutivo, a abundancia total de ambos competidores e mantida constante 
com 4 individuos, mas a composi^ao de especies nos diferentes tratamentos e alterada (0,4; 1,3; 2,2; 
3,1; 4,0). Em um delineamento de superficie de resposta, todas as combina0es de abundancia dos 
dois competidores sao estabelecidas em tratamentos diferentes (4x4 = 16 tratamentos). 0 deli¬ 
neamento de superficie de resposta e o preferido, porque segue o principio de uma boa ANOVA de 
dois fatores: os rn'veis do tratamento sao completamente ortogonais (todos os niveis de abundancia 
da Especie A sao representados com todos os da Especie B ).(Ver Inouye, 2001, para mais detalhes. 
Figura modificada a partir de Goldberg & Scheiner, 2001.) 
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controle (5 individuos da Especie A, 0 individuos da Especie B) com uma de adi- 
^ao (5 individuos da Especie A, 5 individuos da Especie B), teremos confundido 
a densidade total (10 individuos) com a presen^a do competidor (Underwood, 
1986, Bernardo et al., 1995). Por outro lado, alguns autores tern argumentado que 
tais mudan 9 as na densidade sao de fato observadas quando uma nova especie 
entra em uma comunidade e estabelece uma popula^ao, de forma que ajustar pela 
densidade total nao necessariamente seja apropriado (Schluter, 1995). 

Em um delineamento substitutivo, a densidade total dos organismos e man- 
tida constante, mas as proponpoes relativas dos dois competidores sao variaveis. 
Esses delineamentos medem a intensidade relativa da competi^ao inter e intra- 
especifica, mas nao medem a for^a absoluta da competi<;ao e assumem que as 
respostas sao comparaveis em diferentes niveis de densidade. 

O delineamento de superficie de resposta correspode a um de dois fatores 
completamente cruzados, que varia tanto a propor^ao relativa quanto a densidade 
de competidores. Pode ser usado para medir a intensidade relativa e a for^a abso¬ 
luta de intera^oes competitivas inter e intraespecificas. No entanto, como em todos 
experimentos de dois fatores com muitos niveis de tratamento, a replica^ao ade- 
quada pode ser um problema. Inouye (2001) revisa com minucia os delineamentos 
de superficie de resposta e outras alternativas para estudos de competi^ao. 

Outras questoes que precisam ser consideradas em experimentos de competi^ao 
incluem: quantos niveis de densidade incorporar no intuito de estimar com acuracia 
efeitos competitivos; como lidar com a falta de independence de individuos den- 
tro de uma replica de tratamento; quando manipular ou controlar as especies nao 
focais; e como lidar com efeitos persistentes (carry over ) e com a heterogeneidade 
espacial que sao gerados em experimentos de remo^ao, nos quais as parcelas sao 
estabelecidas com base na presen^a de uma especie (Goldberg & Scheiner, 2001). 

Delineamentos de parcelas subdivididas O delineamento de parcelas subdivi- 
didas e uma extensao daquele de blocos aleatorizados para dois tratamentos ex- 
perimentais. A terminologia vem de estudos de agronomia, nos quais uma unica 
parcela e dividida em subparcelas, cada uma recebendo um tratamento diferente. 
Para nosso objetivo, tal parcela subdividida e equivalente a um bloco composto 
internamente de replicas dos diferentes tratamentos. 

O que distingue um delineamento de parcelas subdivididas de um de blocos 
aleatorizados e que um segundo fator de tratamento tambem e aplicado - desta vez, 
no nivel da parcela inteira. Voltemos ao exemplo das cracas. Mais uma vez, voce vai 
estabelecer um delineamento de dois fatores, testando os efeitos da preda^ao e do 
substrato. No entanto, suponha que as gaiolas sejam caras, consomem tempo para 
construir e voce suspeite que exista muita varia^ao de micro-habitat no ambiente 
que esteja afetando seus resultados. Em um delineamento de parcelas subdivididas 
voce poderia agrupar os tres substratos, exatamente como fez no delineamento de 
blocos aleatorizados. No entanto, poderia, entao, colocar uma unica gaiola sobre 
todas as tres replicas de substratos dentro de um unico bloco. Neste caso, o trata¬ 
mento de preda^o e tratado como fator de parcela completa, porque um unico 
tratamento de preda^o e aplicado a um bloco inteiro. O tratamento de substrato 
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e tratado como o fator de subparcela, porque todos os tratamentos de 
substrato sao aplicados dentro de um unico bloco. O delineamento de 
parcelas subdivididas e ilustrado na Figura 7.12. 



Numero ID 

Tratamento 
de substrato 

Tratamento de 
preda^ao 

Numero 
do bloco 

Numero decracas 

1 

Granito 

Sem manipula^ao 

1 

12 

2 

Ardosia 

Sem manipula^ao 

1 

10 

3 

Cimento 

Sem manipula^ao 

1 

8 

4 

Granito 

Controle 

2 

14 

5 

Ardosia 

Controle 

2 

10 

6 

Cimento 

Controle 

2 

8 

7 

Granito 

Exclusao de predador 

3 

50 

8 

Ardosia 

Exclusao de predador 

3 

68 

9 

Cimento 

Exclusao de predador 

3 

39 



. 








120 

Cimento 

Inclusao de predador 

40 

2 


Figura 7.12 Exemplo de um delineamento de parcelas subdivididas. Os simbolos dos trata¬ 
mentos sao dados na Figura 7.9. Os tres tratamentos de substrato (fator de subparcela) sao agru- 
pados em blocos. 0 tratamento de predagao (fator de parcela completa), em um bloco inteiro. A 
planilha contem colunas para indicar o tratamento de substrato, o de preda^ao e a identifica^ao 
do bloco para cada replica. Apena um subconjunto dos blocos em cada tratamento de predagao 
e ilustrado. 0 delineamento de parcelas subdivididas e similar ao de blocos aleatorizados (Figura 
7.6), mas, nesse caso, um segundo fator de tratamento e aplicado ao bloco inteiro (= parcela). 
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Voce deve comparar, com cuidado, o esquema de dois fatores (Figura 7.10) 
e o de parcelas subdivididas (Figura 7.12) para entender a sutil diferen^a entre 
eles. A distin^ao e que, no delineamento de dois fatores, cada replica recebe as 
aplica^oes dos tratamentos independente e separadamente. No esquema de par¬ 
celas subdivididas, um dos tratamentos e aplicado a blocos ou parcelas inteiras e o 
outro tratamento, as replicas dentro dos blocos. 

A principal vantagem do delineamento de parcelas subdivididas e o uso efi- 
ciente de blocos para a aplica^ao de dois tratamentos. Como no delineamento 
de blocos aleatorizados, e um esquema simples que controla a heterogeneidade 
ambiental. Ele tambem pode ser menos trabalhoso do que aplicar tratamentos a 
replicas individuais em um delineamento de dois fatores. O delineamento de par¬ 
celas subdivididas remove os efeitos aditivos dos blocos e permite testar os efeitos 
principais e as intera^oes entre os dois fatores manipulados/ 

Como no de blocos aleatorizados, o delineamento de parcelas subdivididas 
nao permite testar a intera<;ao entre os blocos e o fator de subparcelas. No entanto, 
o delineamento de parcelas subdivididas permite testar o efeito principal do fator 
de parcela completa, o efeito principal do fator de subparcela e a intera^ao entre 
os dois. Como nos aninhados, um erro comum e os investigadores analisarem um 
delineamento de parcelas subdivididas como se fosse uma ANOVA de dois fato¬ 
res, o que aumenta o risco de erro Tipo I. 

Delineamentos para tres ou mais fatores O delineamento de dois fatores 
pode ser estendido para tres ou mais fatores. Por exemplo, se voce estivesse es- 
tudando cascatas troficas em uma cadeia alimentar de agua doce (Brett & Gol¬ 
dman, 1997) poderia adicionar ou remover carnivoros de topo, predadores e 
herbivoros, e entao medir os efeitos no nivel dos produtores. Esse delineamento 
simples de tres fatores gera 2 3 = 8 combina^oes de tratamentos, incluindo uma 
que nao tenha carnivoros de topo, predadores e nem herbivoros (Tabela 7.3). 
Como vimos, se fizermos um delineamento de blocos aleatorizados com um 
esquema de dois fatores replicando dentro de blocos, estes passam a ser um ter- 
ceiro fator na analise. No entanto, delineamentos de tres (ou mais) fatores raras 
vezes sao usados em estudos ecologicos. Existem simplesmente muitas combi- 
na^oes de tratamentos para tornar esse delineamento logisticamente viavel. Se 


Embora o exemplo que apresentamos tenha usado dois fatores manipulados experimentalmente, 
o delineamento de parcelas subdivididas tambem e eficiente quando um dos dois fatores representa 
uma fonte de varia<;ao natural. Por exemplo, em nossa pesquisa, estudamos a organiza^ao de cadeias 
troficas aquaticas que se desenvolvem nas folhas cheias de agua da chuva da planta-jarro Sarracenia 
purpurea. Um jarro novo se abre aproximadamente a cada 20 dias, fica cheio com agua da chuva e 
rapidamente desenvolve uma cadeia alimentar associada de invertebrados e microrganismos. 

Em um de nossos experimentos, manipulamos o regime de perturba<;ao adicionando ou re- 
movendo agua das folhas de cada planta (Gotelli et al., nao publicado). Essas manipulates de agua 
foram aplicadas a todos os jarros de uma planta. Depois, registramos a estrutura da cadeia alimentar 
no primeiro, no segundo e no terceiro jarros. Esses dados sao analisados como um delineamento 
de parcelas subdivididas. O fator de parcela completa e o tratamento de agua (5 niveis) e o fator de 
subparcela, a idade do jarro (3 niveis). A planta serviu como um bloco natural e foi eficiente e realis- 
tico aplicar os tratamentos de agua a todas as folhas de uma planta. 
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TABELA 7.3 Combina^oes de tratamentos em um esquema com tres fatores 
para um experimento de cadeia alimentar de adi^ao e remo^ao 



Carmvoro ausente 

Carmvoro presente 


Herbivoro 

ausente 

Herbivoro 

presente 

Herbivoro 

ausente 

Herbivoro 

presente 

Produtor ausente 

10 

10 

10 

10 

Produtor presente 

10 

10 

10 

10 


Neste experimento, os tres grupos troficos representam os tres fatores experimentais (carnivoros, herbivo- 
ros, produtores) cada um com dois niveis (ausente, presente). O valor em cada celula e o numero de repli¬ 
cas de cada combina^ao de tratamentos. Se a variavel resposta for alguma propriedade da propria cadeia 
trofica, entao a combina^ao de tratamentos em que todos os niveis troficos estejam ausentes (na caixa) 
logicamente nao sera possivel. 


voce achar que o seu esta se tornando muito grande e complexo, deve considerar 
dividi-lo em um numero menor de experimentos focados nas hipoteses princi¬ 
pals que deseja testar. 

Incorporando a variabilidade temporal: delineamentos de medidas repeti- 
das Em todos os delineamentos que descrevemos ate agora, a variavel resposta 
e medida em cada replica em um unico ponto no tempo, no final do experimen¬ 
to. Um delineamento de medidas repetidas e usado sempre que observances 
multiplas sao coletadas na mesma replica em tempos diversos. O delineamento 
de medidas repetidas pode ser visto como um de parcelas subdivididas em que 
uma linica replica atua como um bloco e o fator de subparcela e o tempo. Os 
delineamentos de medidas repetidas foram primeiramente usados em estudos 
de medicina e de psicologia nos quais repetidas observances eram realizadas por 
individuo. Assim, na terminologia de medidas repetidas, o fator inter-sujeitos 
corresponde ao de parcela completa, e o fator intrassujeitos corresponde aos 
diferentes tempos. No entanto, em um delineamento de medidas repetidas, as 
observances multiplas em um unico individuo nao sao independentes e as ana- 
lises devem ser feitas com cautela. 

Por exemplo, suponha que usamos um simples delineamento de um fator 
para o estudo das cracas, mostrado na Figura 7.5. Porem, alem de fazer contagens 
em cada replica apenas uma vez, medimos o numero de cracas em cada replica 
durante 4 semanas consecutivas. Agora, ao inves de 3 tratamentos x 10 replicas = 
30 observances, temos 3 tratamentos x 10 replicas x 4 semanas = 120 observances 
(Tabela 7.4). Se usarmos dados de apenas uma das contagens, a analise poderia ser 
identica a um esquema de um fator. 

Ha tres vantagens para o delineamento de medidas repetidas. A primeira e a 
eficiencia: os dados sao registrados em tempos diferentes, mas nao e necessario 
ter replicas individuals para cada combinanao de tempo x tratamento. Segundo, 
o delineamento de medidas repetidas permite que cada replica sirva como seu 
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TABELA 7.4 Planilha para uma analise de medidas repetidas simples 


Numero ID 

Tratamento 



Contagens de cracas 


Replica 

Semana 1 

Semana 2 

Semana 3 

Semana 4 

1 

Granito 

1 

12 

15 

17 

17 

2 

Ardosia 

i 

10 

6 

19 

32 

3 

Cimento 

i 

3 

2 

0 

2 

4 

Granito 

2 

14 

14 

5 

11 

5 

Ardosia 

2 

10 

11 

13 

15 

6 

Cimento 

2 

8 

9 

4 

4 

7 

Granito 

3 

11 

13 

22 

29 

8 

Ardosia 

3 

11 

17 

28 

15 

9 

Cimento 

3 

7 

7 

7 

6 

30 

Cimento 

10 

8 

0 

0 

3 


Este experimento e delineado para testar os efeitos do tipo de substrato sobre o recrutamento de cracas na 
zona intertidal rochosa (Figura 7.5). O dados sao organizados em uma planilha, na qual cada linha e uma 
replica independente. As colunas indicam o numero ID (1-30), o grupo de tratamento (cimento, ardosia, 
ou granito) e o numero da replica (1-10 dentro de cada tratamento). As quatro colunas seguintes fornecem 
o numero de cracas registradas em um substrato particular em cada uma das quatro semanas consecutivas. 
As medidas, em diferentes momentos, nao sao independentes umas das outras, porque sao obtidas em uma 
mesma replica todas as semanas. 


proprio bloco ou controle. Quando as replicas representam individuos (plantas, 
animais, ou humanos), isto efetivamente controla a varia^ao de tamanho, idade 
e historia individual, que frequentemente exercem fortes influences na variavel 
resposta. Por fim, o delineamento de medidas repetidas nos permite testar as 
intera^oes do tempo com o tratamento. Por varias razoes, esperamos que di- 
feren<;as entre tratamentos possam mudar com o tempo. Em um experimento 
de pressao (Capitulo 6), pode haver efeitos cumulativos do tratamento que nao 
serao expressos ate algum tempo depois do inicio do experimento. Em contraste, 
em um experimento de pulso, esperamos ver as diferen^as entre tratamentos di- 
minuirem a medida que o tempo passa desde o unico pulso de aplica<;ao do tra¬ 
tamento. Tais efeitos complexos sao melhor observados na intera^ao entre tempo 
e tratamento, e podem nao ser detectados se a variavel resposta for medida em 
um unico ponto no tempo. 

O delineamento de blocos aleatorizados e o de medidas repetidas assumem 
um pressuposto especial de circularidade para o fator intrassujeitos. Circula- 
ridade (no contexto de ANOVA) significa que a variancia das diferen^as entre 
quaisquer dois niveis de tratamento na subparcela e a mesma. Para o delinea¬ 
mento de blocos aleatorizados, isso significa que a variancia da diferen<;a entre 
qualquer par de tratamentos no bloco e a mesma. Se as parcelas dos tratamentos 
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forem grandes o bastante alem de adequadamente espa^adas, este frequente- 
mente sera um pressuposto razoavel. Para o delineamento de medidas repetidas, 
o pressuposto de circularidade significa que a variancia da diferen^a das obser¬ 
vances entre qualquer par de tempos e a mesma. O pressuposto de circularidade 
e improvavel de ser alcannado para medidas repetidas. Na maioria dos casos, 
a variancia da diferenna entre duas observances consecutivas e provavelmente 
muito menor que a variabilidade da diferenna entre duas observances que sao 
amplamente espanadas no tempo. Isso porque e provavel que series temporais 
medidas sobre um mesmo sujeito apresentem uma “memoria” temporal, de for¬ 
ma que os valores atuais sejam uma funnao dos valores observados no passado 
recente. Esta premissa de observances correlacionadas e a base para analises de 
series temporais (Capitulo 6). 

A desvantagem principal com analises de medidas repetidas e a falha em cum- 
prir o pressuposto de circularidade. Se as medidas repetidas sao serialmente cor¬ 
relacionadas, as taxas de erro Tipo I para testes F serao infladas e a hipotese nula 
pode ser rejeitada incorretamente quando ela for verdadeira. A melhor maneira 
de cumprir o pressuposto de circularidade e usar tempos amostrais espanados 
com regularidade em conjunto ao conhecimento de historia natural de seus orga- 
nismos para selecionar um intervalo amostral apropriado. 

Para analise de medidas repetidas que nao dependam do pressuposto de cir¬ 
cularidade, ha algumas alternativas: uma abordagem e estabelecer replicas sufi- 
cientes para que um conjunto diferente seja amostrado em cada periodo de tem¬ 
po. Com esse delineamento, o tempo pode ser tratado como um fator simples em 
uma analise de variancia de dois fatores. Se os metodos amostrais sao destrutivos 
(p. ex., coletar o conteudo estomacal de peixes, matar e preservar uma amostra de 
invertebrados, ou arrancar plantas), esta e a unica maneira de incorporar o tempo 
ao delineamento. 

Uma segunda estrategia e usar um esquema de medidas repetidas, mas ser 
mais criativo no delineamento da variavel resposta. Unir as medidas repetidas 
correlacionadas em uma unica variavel resposta para cada individuo e entao usar 
uma simples analise de variancia de um fator. Por exemplo, se voce deseja testar 
se tendencias temporais diferem entre tratamentos (o fator inter-sujeitos), voce 
poderia ajustar uma linha de regressao (com um modelo linear ou um de serie 
temporal) aos dados de medidas repetidas e usar a inclinanao da linha como va¬ 
riavel resposta. Um valor de inclinanao separado poderia ser calculado para cada 
um dos individuos no estudo. As inclinanoes poderiam, entao, ser comparadas 
usando uma analise simples de um fator, tratando cada individuo como uma ob- 
servanao independente (e sao). Os efeitos significativos do tratamento poderiam 
indicar diferentes trajetorias temporais para individuos nos diversos tratamentos. 
Esse teste e muito parecido ao da interanao entre tempo e tratamento em uma 
analise de medidas repetidas padrao. 

Embora tais variaveis compostas sejam criadas a partir de observances cor¬ 
relacionadas coletadas a partir de um individuo, elas sao independentes entre 
individuos. Alem disso, o Teorema do Limite Central (Capitulo 2) nos diz que 
as medias desses valores vao seguir uma distribuinao aproximadamente nor- 
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mal mesmo se as proprias variaveis subjacentes nao sigam. Como a maioria 
dos dados de medidas repetidas nao cumpre o pressuposto de circularidade, 
nosso conselho e ser cuidadoso com tais analises. Preferimos unir os dados 
temporais em uma unica variavel que seja verdadeiramente independente en- 
tre observances e, entao, usar um delineamento mais simples de um fator para 
a analise. 

Impactos ambientais ao longo do tempo: delineamentos adci Um tipo espe¬ 
cial de medidas repetidas e um em que sao realizadas medidas antes e depois da 
aplica^ao de um tratamento. Por exemplo, suponha que voce esteja interessado 
em medir o efeito da atrazina (um composto que mimetiza hormonios) sobre o 
tamanho corporal de sapos (Allran & Karasov, 2001). Em um esquema simples 
de um fator, voce poderia atribuir os sapos de maneira aleatoria a grupos contro- 
le e tratamento, aplicar a atrazina e medir o tamanho corporal ao final do expe- 
rimento. Um delineamento mais sensivel seria estabelecer os grupos controle e 
tratamento e fazer medidas de tamanho corporal durante um ou mais periodos 
de tempo antes da aplicanao do tratamento. Depois, voce mede novamente o 
tamanho corporal varias vezes nos grupos controle e tratamento. 

Esses delineamentos tambem sao usados em estudos observacionais que 
avaliam impactos ambientais. Em avalia^ao de impactos, as medidas sao feitas 
antes e depois de ele acontecer. Uma avalia^ao tipica poderia ser das potenciais 
respostas de uma comunidade de invertebrados marinhos a opera^ao de uma 
usina de energia nuclear, que despeja um consideravel efluente de agua quen- 
te (Schroeter et al., 1993). Antes de a usina iniciar a opera^o, voce faz uma 
ou mais amostras na area que sera afetada e estima a abundancia de especies 
de interesse (p. ex., caramujos, estrelas-do-mar, ourinos-do-mar). A replica- 
<;ao neste estudo pode ser espacial, temporal ou ambas. A primeira exigiria 
amostras em muitas parcelas diferentes dentro e fora da projenao da mancha 
de agua quente despejada. 8 A replica^ao temporal exigiria amostrar um uni- 
co local na area de despejo em varios momentos antes de a usina ser ativada. 
Idealmente, multiplos locais poderiam ser amostrados varias vezes no periodo 
pre-despejo. 

Uma vez que o despejo tenha come^ado, o protocolo de amostragem e repe- 
tido. Nesse delineamento de avalia^ao, e indispensavel que haja no minimo um 
local de controle ou de referenda que seja amostrado ao mesmo tempo, tanto 
antes quanto depois do despejo. Entao, se voce observar um declinio na abundan¬ 
cia no local impactado, mas nao no local de controle, voce pode testar quando o 
declinio sera significativo. Alem disso, a abundancia de invertebrados pode estar 
diminuindo por razoes que nada tern a ver com o despejo de agua quente. Neste 


8 Um pressuposto-chave neste esquema e que o investigador conhece por antecedencia o alcance es¬ 
pacial do impacto. Sem esta informa<;ao, algumas das parcelas “controle” podem terminar dentro da 
regiao do “tratamento” e o efeito da mancha de agua quente poderia ser subestimado. 
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caso, voce encontraria menor abundancia tanto nos locais de controle quanto nos 
impactados. 

Este tipo de delineamento de medidas repetidas e tratado como um delinea- 
mento ADCI (Antes-Depois, Controle-Impacto). Nao ha apenas replica^ao de 
parcelas-controle e tratamento, existe tambem replica^ao temporal com medidas 
anteriores e posteriores a aplica«;ao do tratamento (Figura 7.13). 

Em sua forma ideal, o delineamento ADCI e um esquema poderoso para ava- 
liar perturba^oes ambientais e monitorar trajetorias antes e depois do impacto. A 
replica<;ao no espa^o garante que os resultados serao aplicaveis a outros locais que 
possam vir a ser perturbados da mesma forma. A replica^ao ao longo do tempo 
garante que a trajetoria temporal de resposta e recupera<;ao possa ser monitorada. 
O delineamento e apropriado tanto para disturbios ou experimentos de pulso 
quanto para experimentos de pressao. 

Infelizmente, este delineamento ADCI idealizado raras vezes e alcan^ado em 
estudos de impacto ambiental. Muitas vezes existe apenas um unico local, que sera 
impactado, e em geral nao e escolhido aleatoriamente (Stewart-Oaten & Bence 
2001, Murtaugh, 2002b). As replicas espaciais dentro da area impactada nao sao 
independentes, porque existe apenas um linico impacto estudado em um unico 
local (Underwood, 1994). Se o impacto representa um acidente ambiental, como 
um derramamento de oleo, pode nao haver nenhum dado pre-impacto disponi- 
vel, nem para locais de referenda quanto para os impactados. 

O controle potencial da aleatoriza^ao e atribui<;ao de tratamentos sao muito 
melhores em manipulates experimentais em larga escala, mas mesmo nestes ca- 
sos havera pouca, se houver alguma, replica^ao espacial. Tais estudos dependem 
de replica^ao temporal mais intensiva, tanto antes quanto depois da manipula^o. 
Por exemplo, desde 1983, Brezonik et al. (1986) conduzem um experimento de 
acidifica«;ao de longo prazo no Lago Little Rock, um pequeno lago oligotrofico de 
infiltra^ao no norte de Wisconsin. O lago foi dividido em duas represas, uma de 
tratamento e uma de referenda, usando uma Iona de vinil impermeavel. Dados 
de referenda (pre-manipula^ao) foram coletados em ambas de agosto de 1983 ate 
abril de 1985. A represa de tratamento foi entao acidificada, de maneira gradativa, 
com acido sulfurico em tres niveis de pH (5,6; 5,1; 4,7). Esses niveis de pH foram 
mantidos em um experimento de pressao com intervalos de dois anos. 

Como havia apenas uma bacia de tratamento e uma bacia de controle, os me- 
todos convencionais de ANOVA nao podem ser usados para analisar esses dados. 9 
Existem duas estrategias gerais para analise. A analise de interven$ao randomi- 
zada (RIA) e um procedimento de Monte Carlo (ver Capitulo 5), no qual uma 


9 Com certeza, se alguem assumir que as amostras sao replicas independentes, a ANOVA conven- 
cional pode ser usada. Mas nao ha prudencia em for^ar os dados a uma estrutura de modelo a 
qual eles nao se ajustam. Um dos assuntos centrais deste capitulo e escolher delineamentos sim¬ 
ples para os seus experimentos e amostragens, cujos pressupostos se adaptem melhor as restri^oes 
dos seus dados. 
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Numero ID: 6 
Tratamento: Impacto 


Zona de impacto 
de despejo de efluente 


Usina de for<;a 


Numero ID: 1 
Tratamento: Controle 


Numero 

ID 

Tratamento 

Amostragem pre-impacto 

Amostragem pos-impacto 

Semana 1 

Semana 2 

Semana 3 

Semana 4 

Semana 5 

Semana 6 

Semana 7 

Semana 8 

1 

Controle 

106 

108 

108 

120 

122 

123 

130 

190 

2 

Controle 

104 

88 

84 

104 

106 

119 

135 

120 

3 

Impacto 

99 

97 

102 

192 

150 

140 

145 

150 

4 

Impacto 

120 

122 

98 

120 

137 

135 

155 

165 

5 

Impacto 

88 

90 

92 

94 

0 

7 

75 

77 

6 

Impacto 

100 

120 

129 

82 

2 

3 

66 

130 

7 

Controle 

66 

70 

70 

99 

45 

55 

55 

109 

8 

Controle 

130 

209 

220 

250 

100 

90 

88 

140 


Figura 7.13 Exemplo do arranjo espacial de replicas para urn delineamento ADCI. Cada qua- 
drado representa uma parcela amostral em uma regiao costeira que sera potencialmente afetada 
pelo despejo de agua quente de uma usina nuclear. Parcelas permanentes sao estabelecidas den- 
tro da zona do efluente de agua quente (area sombreada) e em zonas controle adjacentes (areas 
nao sombreadasj.Todas as parcelas sao amostradas semanalmente, durante 4 semanas, antes de 
a usina iniciar o despejo agua quente e por 4 semanas apos. Cada linha da planilha representa 
uma replica diferente. Duas colunas indicam o numero ID da replica e o tratamento (Controle ou 
Impacto). As colunas restantes dao os dados de abundancia de invertebrados coletados em cada 
uma das 8 datas de amostragem (4 datas de amostragem pre-despejo, 4 datas de amostragem 
pos-despejo). 


estatistica de teste calculada a partir da serie temporal e comparada a uma dis¬ 
tribute) de valores criada pela aleatoriza^ao ou permuta^ao dos dados da serie 
temporal entre os intervalos de tratamento (Carpenter et al., 1989). A RIA relaxa 
o pressuposto de normalidade, mas ela continua suscetivel as correlates tempo¬ 
ral nos dados (Stewart-Oaten et al., 1992). 

Uma segunda estrategia e usar a analise de series temporais para ajustar rao- 
delos simples aos dados. O modelo autorregressivo integrado de medias moveis 
(ARIMA) descreve a estrutura de correla^ao em dados temporais com poucos 
parametros (ver Capitulo 6). Os parametros adicionais do modelo estimam as 
mudan^as gradativas que ocorrem com as interven 9 oes experimentais e esses pa¬ 
rametros podem ser testados contra a hipotese nula de que eles nao diferem de 
0. Os modelos ARIMA podem ser ajustados individualmente aos dados da serie 
temporal de controle e de manipula^ao, ou a uma serie derivada de dados criada 
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pela razao entre os dados de tratamento/controle de cada passo de tempo (Ras¬ 
mussen et al., 1993). Os metodos bayesianos tambem podem ser usados para ana- 
lisar dados de delineamentos ADCI (Carpenter et al., 1996; Rao & Tirtotjondro, 
1996; Reckhow, 1996; Varis & Kuikka, 1997; Fox, 2001). 

A RIA, o ARIMA e os metodos bayesianos sao ferramentas poderosas para de- 
tectar efeitos de tratamentos em dados de series temporais. No entanto, sem repli¬ 
cate, ainda sera problematic© generalizar os resultados da analise. O que poderia 
acontecer em outros lagos? Outros anos? Informa^oes adicionais, incluindo os 
resultados de experimentos em pequena escala (Frost et al., 1988), ou compara¬ 
tors instantaneas com um grande numero de locais de controle sem manipulate 
(Schindler et al., 1985; Underwood, 1994) podem ajudar a expandir o dominio de 
inferencia a partir de um estudo ADCI. 

Alternativas a ANOVA: experimento de regressao 

A literatura sobre delineamento experimental e dominada por esquemas de ANO¬ 
VA e a ciencia ecologica moderna tern sido tratada sarcasticamente como pouco 
mais que o cuidado e curadoria de tabelas de ANOVA. Embora os delineamentos 
de ANOVA sejam convenientes e poderosos para varios propositos, nem sempre 
sao a melhor escolha. A ANOVA se tornou tao popular que pode agir como uma 
camisa-de-for^a intelectual (Werner, 1998) e levar os cientistas a negligenciar ou¬ 
tros delineamentos experimentais uteis. 

Sugerimos que um delineamento de regressao seja aplicado, por parecer mais 
propriado, em vez dos delineamentos de ANOVA. Em muitos delineamentos de 
ANOVA uma variavel preditora continua e testada com apenas alguns poucos va- 
lores, de forma que ela possa ser tratada como uma variavel preditora categorica 
e ser condensada em um delineamento como esse. Exemplos incluem niveis de 
tratamento que representam diferentes concentrates de nutrientes, temperatu- 
ras ou niveis de recursos. 

Em contraste, um delineamento experimental de regressao (Figura 7.14) usa 
varios niveis diferentes da variavel continua independente; depois, usa regressao 
para ajustar uma linha, uma curva ou uma superficie aos dados. Uma ques- 
tao complicada em tal delineamento (o mesmo problema esta presente em uma 
ANOVA) e escolher os niveis apropriados para a variavel preditora. Uma sele- 
to uniforme de valores preditores dentro da amplitude desejada deve garantir 
maior poder estatistico e um ajuste razoavel a linha de regressao. No entanto, 
se a resposta esperada for multiplicativa, em vez de linear (p. ex., uma redu^ao 
de 10% no crescimento a cada duplicate da concentrate), pode ser melhor 
estabelecer os valores do preditor em uma escala logaritmica espa^ada de ma- 
neira uniforme. Nesse delineamento voce tera mais dados coletados em baixas 
concentrates, no qual se espera que as mudan^as na variavel resposta sejam 
mais abruptas. 

Uma das principals vantagens dos delineamentos de regressao e a eficiencia. 
Suponha que voce esteja estudando respostas de plantas terrestres e comunida- 
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(Tratamentos simultaneos deNePemum 
delineamento de ANOVA de dois fatores) 

Tratamento de nitrogenio 

0,00 mg 

0,50 mg 

Tratamento 
de fosforo 

0,00 mg 

12 

12 

0,05 mg 

12 

12 


(Delineamento experi- 


mental de regressao 
com dois fatores) 

Tratamento de nitrogenio 

0,00 mg 

0,05 mg 

0,10 mg 

0,20 mg 

0,40 mg 

0,80 mg 

1,00 mg 

Tratamento 
de fosforo 

0,00 mg 

1 

1 

1 

1 

1 

1 

1 

0,01 mg 

1 

1 

1 

1 

1 

1 

1 

0,05 mg 

1 

1 

1 

1 

1 

1 

1 

0,10 mg 

1 

1 

1 

1 

1 

1 

1 

0,20 mg 

1 

1 

1 

1 

1 

1 

1 

0,40 mg 

1 

1 

1 

1 

1 

1 

1 

0,50 mg 

1 

1 

1 

1 

1 

1 

1 


Figura 7.14 Combina^ao de tratamentos em um delineamento de ANOVA de dois fatores (pai- 
nel superior) e um delineamento experimental de regressao (painel inferior). Esses experimentos 
testam os efeitos aditivos e de intera^ao do nitrogenio (N) e do fosforo (P) sobre o crescimento 
de plantas ou alguma outra variavel resposta. Cada celula, na tabela, indica o numero de replicas 
usadas. Se o numero maximo de replicas for 50 e um mi'nimo de 10 por tratamentos seja necessario, 
apenas 2 ni'veis de tratamento sao possiveis para cada N e P (cada um com 12 replicas) na ANOVA 
de dois fatores. Em contraste, a regressao experimental permite 7 ni'veis de tratamentos para cada 
N e P. Cada uma das 7 x 7 = 49 parcelas no delineamento recebe uma combina^ao unica de con¬ 
centrates de N e P. 


des de insetos ao nitrogenio (N), e que seu tamanho amostral total seja limita- 
do a 50 parcelas, por causa do espa^o ou esfor^o disponlvel. Se voce tentar se- 
guir a Regra dos 10, um delineamento de ANOVA poderia for^a-lo a selecionar 
apenas 5 niveis diferentes de fertiliza<;ao e replicar cada um 10 vezes. Embora 
esse delineamento seja adequado para alguns propositos, ele pode nao ajudar 
a identificar os niveis criticos limiares nos quais a estrutura da comunidade 
muda dramaticamente em resposta ao N. Em contraste, um delineamento de 
regressao permitiria voce estabelecer 50 niveis diferentes de N, um por parcela. 
Com esse delineamento voce pode caracterizar, com acuracia, as mudan^as que 
ocorram na estrutura da comunidade com o aumento dos niveis de N. As exi- 
bi^oes graficas podem ajudar a revelar os pontos limiares e efeitos nao lineares 
(ver Capitulo 9). Certamente, ate mesmo a replica^ao minima de cada nivel de 
tratamento e muito desejavel, mas, se o tamanho amostral total for limitado, 
pode nao ser possivel. 

Para uma ANOVA de dois fatores, um experimento de regressao e ainda mais 
eficiente e poderoso. Se voce deseja manipular nitrogenio e fosforo (P) como fa¬ 
tores independentes e ainda manter 10 replicas por tratamento, nao poderia ter 
mais do que dois niveis de N e dois de P. Como um dos niveis precisa ser uma 
parcela-controle (i. e., sem fertiliza^ao), o experimento nao lhe fornecera muita 
informa^ao sobre o papel dos diferentes niveis de N e P no sistema. Se o resulta- 
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do for estatisticamente significative, voce podera dizer apenas que a comunidade 
responde aqueles niveis de N e P em particular, que e algo que voce ja poderia 
saber a partir da literatura antes de ter come^ado. Se, ao contrario, o resultado nao 
for estatisticamente significativo, a critica obvia e que as concentrates de N e P 
foram muito baixas para gerar uma resposta. 

Em contraste, um delineamento experimental de regressao poderia ser um 
delineamento completamente cruzado com 7 niveis de nitrogenio e 7 niveis de 
fosforo, com um nivel de cada correspondendo ao controle (sem N e sem P). Cada 
uma das 7x7-49 replicas recebe uma concentra^ao unica de N e P, e uma das 49 
parcelas nao recebe N nem P (Figura 7.14). Eis um delineamento de superficie de 
resposta (Inouye, 2001), no qual a variavel resposta sera modelada por regressao 
multipla. Com 7 niveis de cada nutriente, esse delineamento proporciona um tes¬ 
te muito mais robusto para efeitos aditivos e de intera^ao dos nutrientes, e ainda 
poderia revelar respostas nao lineares. Se os efeitos de N e P sao fracos ou sutis, 
o modelo de regressao tera mais chance de revelar efeitos significativos do que a 
ANOVA de dois fatores. 10 

A eficiencia nao e a unica vantagem de um delineamento experimental de 
regressao. Ao representar naturalmente a variavel preditora em uma escala conti- 
nua, sera muito mais facil detectar respostas nao lineares, limiares ou assintoticas. 
Isso nao pode ser inferido com confian^a a partir de um modelo de ANOVA, que 
em geral nao tern niveis de tratamentos suficientes para ser informativo. Se a re- 
la^ao for outra que nao uma linha reta, existe uma gama de metodos estatisticos 
para ajustar respostas nao lineares (ver Capitulo 9). 

Uma ultima vantagem em usar um delineamento experimental de regressao e 
o beneficio potencial de integrar seus resultados com predi<;6es teoricas e modelos 
ecologicos. A ANOVA fornece estimativas de medias e variancias para grupos ou 
niveis de variaveis categoricas em particular. Essas estimativas raras vezes sao de 
interesse ou uso em modelos ecologicos. Em contraste, uma analise de regressao 
fornece estimativas dos parametros de inclina^ao e intercepto que medem a mu- 
dan 9 a na resposta Y relativa a mudan<;a no preditor X (dY/dX). Essas derivadas 
sao o que se precisa para testar varios modelos ecologicos descritos como simples 
equates diferenciais. 


10 Ha, ainda, uma penaliza^ao oculta que geralmente nao e reconhecida em usar um delineamento de 
ANOVA de dois fatores para este experimento. Se os niveis do tratamento representam um pequeno 
subconjunto de varios outros niveis possiveis, entao o delineamento e tratado como um modelo de 
ANOVA de efeitos aleatorios. A menos que exista algo especial acerca dos niveis dos tratamentos em 
particular que foram usados, um modelo de efeitos aleatorios sempre e a escolha mais apropriada 
quando uma variavel continua tenha sido condensada em uma categorica para ANOVA. No modelo 
de efeitos aleatorios, o denominador no teste da razao-F para os efeitos do tratamento e o quadrado 
medio da intera^ao, e nao o quadrado medio do erro, que e usado no modelo padrao de ANOVA de 
efeitos fixos. Se nao houver muitos niveis de tratamento, nao havera muitos graus de liberdade asso- 
ciados com o termo de intera^ao, independente da quantidade de replica^ao dentro dos tratamentos. 
Ver Capitulo 10 para mais detalhes sobre modelos de ANOVA com efeitos fixos e aleatorios e a para 
a constru<^ao das razoes-F. 
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Uma abordagem de regressao experimental pode nao ser viavel se for muito 
caro ou demorado estabelecer niveis unicos da variavel preditora. Nesse caso, um 
delineamento de ANOVA pode ser preferivel, porque apenas alguns poucos niveis 
da variavel preditora podem ser estabelecidos. Uma desvantagem aparente do ex- 
perimento de regressao e que ele aparenta nao ter replica^ao! Na Figura 7.14, cada 
nivel unico de tratamento e aplicado em apenas uma replica e isso parece ir contra 
o principio de replica^ao (ver Capitulo 6). Se cada tratamento unico nao for re- 
plicado, a solu<;ao de minimos quadrados para a linha de regressao ainda fornece 
uma estimativa dos parametros da regressao e de suas variancias (ver Capitulo 9). 
A linha de regressao fornece uma estimativa nao enviesada do valor esperado da 
resposta Y para um dado valor do preditor X e a estimativa da variancia pode ser 
usada para construir um intervalo de confian 9 a acerca dessas estimativas. Isso, 
na verdade, e mais informativo que os resultados de um modelo de ANOVA, que 
lhe permite estimar medias e intervalos de confian<;a para apenas o punhado de 
niveis de tratamentos que foram usados. 

Uma questao potencialmente mais seria e que o delineamento de regressao 
pode nao incluir qualquer replica^ao do controle. Em nosso exemplo de dois fa- 
tores, ha apenas uma parcela sem adi<pao de nitrogenio e fosforo. Se esse sera um 
problema serio ou nao dependera dos detalhes do delineamento experimental. 
Uma vez que todas as replicas sejam tratadas igualmente e difiram apenas na apli- 
caqao do tratamento, o experimento permanece valido e os resultados estimarao, 
com acuracia, os efeitos relativos dos diferentes niveis da variavel preditora sobre 
a variavel resposta. Se for desejavel estimar o efeito absoluto do tratamento, entao 
um adicional de replicas de parcelas-controle pode ser necessario para levar em 
conta qualquer efeito do manuseio ou outras respostas as condi<;oes experimen¬ 
tal em geral. Essas questoes nao sao diferentes daquelas encontradas em deline- 
amentos de ANOVA. 

Historicamente, a regressao tern sido utilizada de forma predominante na 
analise de dados nao experimentais, muito embora seus pressupostos sejam im- 
provaveis de serem cumpridos na maioria dos estudos amostrais. Um estudo ex¬ 
perimental com base em um delineamento de regressao nao apenas cumpre os 
pressupostos da analise, mas com frequencia tambem e mais robusto e apropria- 
do que um delineamento de ANOVA. Aconselhamos a “pensar fora da caixinha da 
ANOVA” e considerar um delineamento de regressao quando estiver manipulan- 
do variaveis preditoras continuas. 

Delineamentos tabulares 

A ultima classe de delineamentos experimentais e usada quando a variavel predi¬ 
tora e a resposta sao categoricas. As medidas nesse delineamento sao contagens. 
A variavel mais simples e uma resposta dicotomica (ou binomial, ver Capitulo 
2) em uma serie de tentativas independentes. Por exemplo, em um teste sobre o 
comportamento de baratas, voce pode colocar uma barata em uma arena com 
um lado preto e outro branco e registrar em que lado o animal passa a maior 
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parte do tempo. Para garantir independencia, cada barata replicada seria testada 
individualmente. 

Na maioria das vezes, uma resposta dicotomica sera registrada para duas ou 
mais categorias da variavel preditora. No estudo das baratas, metade delas pode- 
ria estar infectada experimentalmente com um parasita conhecido por alterar o 
comportamento do hospedeiro (Moore, 1984). Agora questionamos se a resposta 
das baratas difere entre individuos parasitados e nao parasitados (Moore, 2001; 
Poulin, 2000). Essa abordagem poderia ser estendida para um delineamento de 
tres fatores, adicionando um tratamento adicional e perguntando se a diferenna 
entre individuos parasitados e nao parasitados muda na presenna ou ausencia de 
um vertebrado predador. 

Poderiamos predizer que e mais provavel que individuos nao infectados 
usem o substrato preto, que ira torna-lo menos evidente a um predador visual. 
Na presenna do predador, os individuos nao infectados se deslocariam ainda 
mais para as superficies escuras, enquanto os infectados, para as superficies 
brancas. Alem disso, o parasita poderia alterar o comportamento do hospedeiro, 
mas essas alteranoes poderiam ser independentes da presenqa ou ausencia do 
predador. Ainda outra possibilidade seria a de que o comportamento do hos¬ 
pedeiro poderia ser muito sensivel a presenqa do predador, mas nao necessa- 
riamente afetado pela infec^ao com o parasita. Uma analise de tabela de con¬ 
tingency (Capitulo 11) e usada para testar todas essas hipoteses com o mesmo 
conj unto de dados. 

Em alguns delineamentos tabulares, o investigador determina o numero total 
de individuos em cada categoria da variavel preditora e esses individuos serao 
classificados de acordo com suas repostas. O total para cada categoria e tratado 
como total marginal, porque representa a soma da coluna ou da linha na margem 
da tabela de dados. Em um estudo observacional, o investigador pode determi- 
nar um ou ambos dos totais marginais ou apenas o total geral das observances 
independentes. Em um delineamento tabular, o total geral e igual a soma do total 
marginal da coluna ou da linha. 

Digamos que voce esteja tentando determinar as associates de quatro es¬ 
pecies de lagartos Anolis com tres tipos de micro-habitats (solo, troncos de 
arvores, galhos de arvores; ver Butler & Losos, 2002). A Tabela 7.5 mostra o 
esquema de dois fatores dos dados desse estudo. Cada linha na tabela repre¬ 
senta uma especie diversa de lagarto e cada coluna representa uma categoria de 
habitat diferente. Os valores em cada celula representam as contagens de uma 
especie de lagarto em especial registradas em um habitat em particular. O total 
marginal das linhas representa o numero total de observances para cada espe¬ 
cie de lagarto, somadas ao longo dos tres tipos de habitats. O total marginal 
das colunas representa o numero total de observances em cada tipo de habitat, 
somadas ao longo das quatro especies de lagarto. O total geral na tabela (N = 
81) representa a contagem total de todas as especies de lagarto observadas em 
todos os habitats. 
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TABELA 7.5 Contagem tabular da ocorrencia de quatro especies de lagartos 
contadas em tres micro-habitats diferentes 


Habitat 



Solo 

Tronco 
de arvore 

Galho 
de arvore 

Total 

das especies 


Especie A 

9 

0 

15 

24 


Especie B 

9 

0 

12 

21 


Especie C 

9 

5 

0 

14 

Especies de 

Especie D 

9 

10 

3 

22 

lagarto 

Total dos Habitats 

36 

15 

30 

81 


Os valores em italico sao os totais marginais para a tabela de dois fatores. O tamanho amostral total e de 81 
observances. Nestes dados, tanto a variavel resposta (identidade das especies) quanto a variavel preditora 
(categoria de micro-habitat) sao categoricas. 


Estes dados poderiam ter sido coletados de diversas maneiras, dependendo 
se a amostragem foi com base no total marginal para o micro-habitat, no total 
marginal para os lagartos ou no total geral para a amostra inteira. 

Em um esquema amostral construido acerca de micro-habitats, o investiga- 
dor poderia gastar 10 horas amostrando cada um e registrando o numero de es¬ 
pecies diferentes de lagartos encontradas em cada habitat. Assim, na contagem de 
troncos de arvores, o investigador encontrou um total de 15 lagartos: 5 da Especie 
C e 10 da Especie D, as Especies A e B nao foram encontradas. Na contagem no 
solo, o investigador encontrou 36 lagartos com todas as especies igualmente re- 
presentadas. 

Como alternativa, a amostragem poderia ter sido fimdamentada nos proprios 
lagartos. Em tal delineamento, o investigador deveria determinar um esforno 
amostral igual para cada especie, procurando todos os habitats de maneira alea- 
toria, em busca de individuos de uma especie de lagarto em especial e registrando 
em qual habitat ela ocorreu. Assim, em uma busca pela Especie B, 21 individuos 
foram encontrados, 9 no solo e 12 em galhos de arvores. Outra variante amostral 
e uma na qual os totais de linha e de coluna sao simultaneamente fixados. Embora 
esse delineamento nao seja muito comum em estudos ecologicos, ele pode ser 
usado para um teste estatistico exato da distribui^ao dos valores amostrados (Tes¬ 
te Exato de Fisher; ver Capitulo 11). Por fim, a amostragem poderia basear-se ape- 
nas no total das observances. Assim, o investigador poderia ter feito uma amostra 
aleatoria de 81 lagartos e para cada encontrado ter registrado a identidade da 
especie e do micro-habitat. 

Idealmente, os totais marginais nos quais a amostragem e fundamentada 
deveriam ser os mesmos para cada categoria, assim como tentamos alcan^ar 
tamanhos amostrais iguais ao estabelecer um delineamento de ANOVA. No 
entanto, tamanhos amostrais identicos nao sao necessarios na analise de dados 
tabulares. Entretanto, os testes requerem (como sempre) que as observances 







Prindpios de Estati'stica em Ecologia 221 


sejam amostradas de maneira aleatoria e que as replicas sejam verdadeiramen- 
te independentes umas das outras. Isso pode ser muito dificil de obter-se em 
alguns casos. Por exemplo, se os lagartos tendem a se agregar ou a se mover em 
grupo, nao podemos simplesmente contar individuos conforme sao encon- 
trados, pois e provavel que um grupo inteiro seja encontrado em um mesmo 
micro-habitat. Nesse exemplo, tambem assumimos que todos os lagartos sejam 
igualmente visiveis ao observador em todos os habitats. Se algumas especies 
ficarem mais visualizaveis em certos habitats que outras, entao as frequences 
relativas irao refletir vieses amostrais em vez de associates das especies com 
os micro-habitats. 

Delineamentos amostrais para dados categOricos Em contraste a extensa 
literatura para delineamentos de regressao e ANOVA, relativamente pouco tern 
sido escrito, em um contexto ecologico, sobre delineamentos amostrais para da¬ 
dos categoricos. Se as observances sao caras e demoradas, todo esfor^o deve ser 
feito para garantir que cada observa^ao seja independente, de forma que um sim¬ 
ples esquema de dois ou multiplos fatores possa ser usado. Infelizmente, varias 
analises de dados categoricos publicadas sao fundamentadas em observances nao 
independentes, algumas coletadas em diferentes momentos ou lugares. Muitos 
estudos comportamentais analisam multiplas observances de um mesmo indivi- 
duo. Tais dados claramente nao podem ser tratados como independentes (Kra¬ 
mer & Schmidhammer, 1992). Se os dados tabulares nao sao amostras aleatorias 
independentes do mesmo espano amostral, voce deveria incorporar as categorias 
temporais ou espaciais como fatores em sua analise. 


Alternativas para os delineamentos tabulares: delineamentos proporcionais 

Se as observances individuals forem acessiveis e puderem ser obtidas em grande 
quantidade, existe uma alternativa aos delineamentos tabulares: uma das varia- 
veis categoricas pode ser transformada em uma medida de propornao (niimero 
de resultados desejados/numero de observanoes), que e uma variavel continua. 
A variavel continua pode, entao, ser analisada usando qualquer um dos metodos 
descritos acima por regressao ou ANOVA. 

Ha duas vantagens de usar delineamentos proporcionais em vez de tabu¬ 
lares. A primeira e que o conjunto padrao de delineamentos de ANOVA e re¬ 
gressao pode ser usado, incluindo o uso de blocos. A segunda vantagem e que a 
analise de proposes pode ser usada para acomodar dados de frequencia que 
nao sao estritamente independentes. Por exemplo, suponha que, para ganhar 
tempo, o experimento das baratas foi estabelecido com 10 individuos colocados 
na arena de uma so vez. Nao seria legitimo tratar os 10 individuos como replicas 
independentes, pela mesma razao que as subamostras de uma linica gaiola nao 
sao replicas independentes em uma ANOVA. No entanto, os dados para esta exe- 
cu^ao podem ser tratados como uma unica replica, para a qual podemos calcu- 
lar a propornao de individuos presentes no lado escuro da arena. Com multiplas 
executes do experimento, agora podemos testar hipoteses acerca das diferen^as 
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na propor^ao entre grupos (p. ex., parasitados versus nao parasitados). O deli- 
neamento ainda e problematic©, pois e possivel que a sele^ao de substratos por 
baratas solitarias seja diferente das de substratos por grupos de baratas. Todavia, 
o delineamento ao menos evita tratar individuos dentro da arena como replicas 
independentes, o que nao sao. 

Embora as proposes, como as probabilidades, sejam variaveis continuas, 
elas estao delimitadas entre 0,0 e 1,0. A transforma^ao do arcoseno da raiz qua- 
drada dos dados de propor^ao pode ser necessaria para cumprir o pressuposto 
de normalidade (Capitulo 8). Uma segunda considera^ao na analise de dados 
proporcionais e a importancia em usar pelo menos 10 tentativas por replica e 
certificar-se de que os tamanhos amostrais sejam os mais equilibrados possivel. 
Com 10 individuos por replica, as possiveis medidas da variavel resposta estao 
no conjunto {0,0; 0,1; 0,2; 0,3; 0,4; 0,5; 0,6; 0,7; 0,8; 0,9; 1,0}. Mas suponha 
que o mesmo tratamento tenha sido aplicado a uma replica na qual apenas 
tres individuos foram usados. Neste caso, os unicos valores possiveis estao no 
conjunto {0,0; 0,33; 0,66; 1,0}. Este pequeno tamanho amostral inflara muito 
a variancia medida e tal problema nao e aliviado por qualquer transforma^ao 
de dados. 

Um problema final com a analise de proposes surge se existirem tres ou 
mais variaveis categoricas. Com uma resposta dicotomica, a propor^ao caracteri- 
za completamente os dados. No entanto, se houver mais de duas categorias, a pro- 
por^ao devera ser definida com cuidado em termos de apenas uma das categorias. 
Por exemplo, se a arena incluir superficies pretas e brancas verticais e horizontais, 
havera quatro categorias a partir das quais as proposes podem ser medidas. 
Assim, a analise poderia ser com base na propor<;ao de individuos usando a su- 
perficie preta horizontal. Alternativamente, a propor^ao poderia ser definida em 
termos de duas ou mais categorias somadas, como a propor^ao de individuos 
usando qualquer superficie vertical (branca ou preta). 


RESUM0 


As variaveis dependentes e independentes sao categoricas ou continuas, e a 
maioria dos delineamentos se ajusta em uma entre quatro categorias possiveis 
com base nesta classifica^ao. Os delineamentos de analise de variancia (ANO- 
VA) sao usados para experimentos cuja variavel independente e categorica e a 
dependente e continua. Os delineamentos uteis de ANOVA incluem as ANO- 
VAs de um e dois fatores, blocos aleatorizados e delineamentos de parcelas sub- 
divididas. Nao apoiamos o uso de ANOVAs aninhadas, na qual subamostras 
nao independentes sao realizadas dentro de uma replica. Os delineamentos de 
medidas repetidas podem ser usados quando observances repetidas sao coleta- 
das em uma unica replica ao longo do tempo. No entanto, esses dados em geral 
sao autocorrelacionados, de forma que os pressupostos da analise podem nao 
ser cumpridos. Nesses casos, os dados temporais deveriam ser condensados 
em uma unica medida independente ou em uma analise de series temporais 
deveria ser usada. 
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Se a variavel independente e continua, um delineamento de regressao e usa- 
do. Os delineamentos de regressao sao apropriados tanto para estudos experi- 
mentais quanto observacionais, embora eles sejam usados predominantemente 
no ultimo. Defendemos o uso crescente de experimentos de regressao em vez de 
ANOVA com apenas alguns poucos niveis da variavel independente representa- 
dos. A amostragem adequada da gama de valores do preditor e importante no 
delineamento de um experimento de regressao adequado. Os delineamentos de 
regressao multipla incluem duas ou mais variaveis preditoras, embora a analise 
se torne problematica caso haja correlates fortes (colinearidade) entre as va¬ 
riaveis preditoras. 

Se tanto a variavel independente quanto a dependente sao categoricas, um 
delineamento tabular e empregado. Os delineamentos tabulares requerem repli¬ 
cas de contagem verdadeiramente independentes. Se as contagens nao sao inde- 
pendentes elas devem ser transformadas de forma que a variavel resposta seja 
uma simples propor<;ao. O delineamento experimental sera entao similar a uma 
regressao ou ANOVA. 

Defendemos delineamentos amostrais e experimentais simples e enfatizamos 
a importancia de coletar dados de replicas que sao independentes umas das ou- 
tras. Boa replica^ao e tamanhos amostrais balanceados aumentarao o poder e a 
confiabilidade das analises. Mesmo as mais sofisticadas nao podem salvar os re- 
sultados de um estudo maldelineado. 



< 


> 


8 

Gestao e Curadoria 

de Dados 


O conjunto de dados e a materia bruta dos estudos cientificos. No entanto, 
raras vezes dedicamos a eles a mesma quantidade de tempo e energia na 
organiza^ao, gestao e curadoria de que disponibilizamos na coleta, analise e pu- 
blica<;ao dos dados. Infelizmente, e muito mais facil usar os proprios dados origi¬ 
nal (brutos) para testar novas hipoteses que extrai-los da literatura. Um requisito 
basico de qualquer estudo cientifico e que ele possa ser repetido por outros pes- 
quisadores. As analises nao podem ser reconstruidas, a menos que os dados ori¬ 
ginal sejam devidamente organizados e catalogados, armazenados em seguran^a 
e tornados disponiveis. Alem disso, e uma exigencia legal que os dados coletados 
como parte de um projeto financiado por recursos publicos (p. ex., subven^oes e 
contratos federais ou estaduais) sejam disponibilizados a outros cientistas e para o 
publico. O compartilhamento de dados e legalmente exigido, pois, tecnicamente, 
a agenda fmanciadora e dona dos dados, e nao o pesquisador. A maioria das agen¬ 
das fmanciadoras concede um bom tempo (em geral, um ou mais anos) para os 
pesquisadores comunicarem seus resultados, antes que os dados tenham que ser 
disponibilizados publicamente. 1 No entanto, a “Lei de Liberdade de Informa^ao” 
(Freedom of Information Act - 5 U.S.C. § 552) garante que qualquer pessoa nos Es- 


1 Esta politica e parte de um acordo de cavalheiros entre as agendas fmanciadoras e a comunidade 
cientifica. Esse acordo funciona porque a comunidade cientifica ate agora tern demonstrado a sua 
boa vontade em tornar os dados disponiveis gratuitamente e em tempo habil. Em geral, ecologos 
e cientistas da area ambiental demoram mais para disponibilizar seus dados que os cientistas que 
trabalham em areas mais orientadas para o mercado (como a biotecnologia e a genetica molecular), 
onde ha maior interesse publico. Da mesma forma, a prepara^ao para o acesso aos dados e as normas 
para a produ^ao dos metadados por parte dos ecologos e cientistas ambientais tern ficado aquem das 
outras areas do conhecimento. Pode-se argumentar que a falta de um GenBank para os ecologos tern 
atrasado o progresso da Ecologia e das Ciencias Ambientais. No entanto, dados ecologicos sao muito 
mais heterogeneos que as sequencias genicas. Por isso, delinear uma unica estrutura que facilite e 
acelere o compartilhamento de dados tern se mostrado uma tarefa dificil. 
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tados Unidos pode solicitar aos cientistas, a qualquer momento, dados coletados 
com recursos publicos. Por todas estas razCes, encorajamos voce a gerenciar seus 
dados com o mesmo cuidado que os coleta, analisa e publica. 


0 PRIMEIRO PASSO: GESTAO DE DADOS BRUTOS 

Nas ciencias de bancada, o caderno de notas do laboratorio e o meio tradicional 
para registrar as observances. Em contrapartida, dados ecologicos e ambientais 
sao registrados de diversas formas. Exemplos incluem observances escritas em ca- 
dernos, rabiscadas em placas de plastico de mergulho ou em papel a prova d’agua, 
ou ditada em gravadores de voz. As medidas de instrumentos digitais sao trans- 
mitidas diretamente para registradores de dados (data loggers), computadores ou 
palmtops, e negativos de oxido de prata ou imagens digitais de satelite. Portanto, a 
primeira responsabilidade com nossos dados e transferi-los rapidamente de suas 
origens heterogeneas para um formato comum que pode ser organizado, conferi- 
do, analisado e compartilhado. 


Planilhas 

No Capitulo 5, ilustramos a forma de organizar os dados em uma planilha. Trata- 
-se de uma pagina eletronica 2 onde cada linha representa uma unica observanao 
(p. ex., a unidade de estudo, como uma folha ou pena, um organismo, ou uma 
ilha), e cada coluna representa uma unica medida ou variavel observada. A entra- 
da em cada celula da planilha, ou no par de linha-por-coluna, e o valor medido 
para a unidade de estudo (a linha) ou da variavel observada (coluna) 3 . Todos os 
tipos de dados utilizados por ecologos e cientistas ambientais podem ser arma- 
zenados em planilhas e a maioria dos delineamentos experimentais (Capitulo 7) 
pode ser representada neste formato. 

Apos a coleta, os dados de campo devem ser inseridos em planilhas assim 
que possivel. Em nossas pesquisas, tentamos transferir os dados de nossas notas 
de campo ou dos instrumentos para planilhas no mesmo dia. Ha varias razCes 


2 Embora os programas comerciais de planilhas eletronicas possam facilitar a organiza^ao e gestao 
de dados, nao e apropriado usa-los para o arquivamento eletronico dos seus dados. Em vez disso, os 
dados arquivados devem ser armazenados como arquivos de texto ASCII (American Standard Code 
for Information Exchange ), que podem ser lidos por qualquer maquina sem recorrer a programas 
comerciais que podem nao existir mais daqui a 50 anos. 

1 1lustramos e trabalhamos apenas com planilhas de duas dimensoes (linha e coluna, tambem 
chamadas de arquivos simples). Independentemente de os dados serem armazenados em for- 
matos com duas ou tres dimensoes, paginas dentro de arquivos eletronicos devem ser exportadas 
como arquivos simples para serem analisadas em programas estatisticos. Embora os programas de 
planilhas frequentemente contenham rotinas estatisticas e geradores de numeros aleatorios, nao 
recomendamos o uso desses programas para analise de dados cientificos. Planilhas eletronicas sao 
adequadas para gerar estatisticas descritivas simples, mas os seus geradores de numeros aleatorios 
e algoritmos estatisticos podem nao ser confiaveis para analises mais complexas (Kniisel, 1998; 
McCullough & Wilson, 1999). 
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importantes para transcrever seus dados imediatamente. Primeiro, voce pode 
verificar, com rapidez, se observances ou unidades experimentais necessarias 
foram perdidas devido ao descuido do pesquisador ou a falha de instrumento. 
Se for necessario voltar e coletar observances adicionais, isto deve ser feito ra- 
pidamente ou os novos dados nao serao comparaveis. Segundo, suas folhas de 
anotanoes normalmente incluirao observances e anotanoes nas margens, alem 
dos numeros registrados. Essas notas nas margens fazem sentido logo que voce 
as faz, porem, elas tern uma vida curta e rapidamente tornam-se incompreensi- 
veis (algumas vezes, ate ilegiveis). Terceiro, uma vez que os dados sao inseridos 
em uma planilha, fique com duas copias, e menos provavel voce extraviar ou 
perder ambas as copias de seus valiosos resultados. Por fim, a rapida organizanao 
dos dados pode agilizar a analise e a publicanao; os dados brutos desorganizados 
certamente nao. 

Os dados devem ser conferidos o mais rapido possivel apos serem digitados 
em uma planilha. No entanto, sua revisao geralmente nao detecta todos os erros e, 
uma vez que os dados tenham sido organizados e catalogados, verificanoes adicio¬ 
nais sao necessarias (assunto discutido posteriormente, neste capitulo). 

Metadados 

Ao mesmo tempo que voce insere os dados em uma planilha, deve comenar a 
construir os metadados (que devem acompanhar os dados). Sao “dados sobre 
dados” e descrevem os atributos-chave do conjunto de dados. Os metadados 4 que 
acompanham um conjunto de dados devem incluir, no minimo: 

• o nome e as informanoes de contato de quern coletou os dados; 

• a informanao geografica sobre o local onde os dados foram coletados; 

• o nome do estudo em que os dados foram coletados; 

• as fontes de apoio que permitiram sua coleta; 

• uma descrinao da organizanao do arquivo de dados, que devera incluir: 

• uma breve descrinao dos metodos usados para coletar os dados; 

• os tipos de unidades experimentais; 

• as unidades de medida ou observanao de cada uma das variaveis; 

• a descrinao de quaisquer abrevianoes utilizadas no arquivo de dados; 


4 Tres “niveis” de metadados foram descritos por Michener et al. (1997) e Michener (2000). Os 
metadados de nivel I incluem uma descrinao basica do conjunto de dados e da estrutura dos dados. 
Metadados de nivel II contem nao apenas as describes e a estrutura dos conjuntos de dados, mas 
tambem informanoes sobre a origem e a localizanao da pesquisa, informanoes sobre a versao dos 
dados e instrunoes sobre como acessar os dados. Por fim, os metadados de nivel III sao considera- 
dos passiveis de auditoria e publicaveis. Os metadados de nivel III incluem todas as informanoes 
daqueles de nivel II mais deserves de como foram obtidos, da documentanao do processo de 
garantia de qualidade e do controle de qualidade (GQ/CQ), uma descrinao completa de qualquer 
programa utilizado no processamento dos dados, uma descrinao clara de como os dados foram ar- 
quivados, um conjunto de publicanoes relacionadas aos dados e uma historia de como o conjunto 
de dados foi utilizado. 
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• uma descri^ao explicita de quais dados estao nas colunas, quais estao nas li- 
nhas e qual caractere foi usado para separar elementos dentro das linhas (p. 
ex., tabulates, espa^os ou virgulas) e entre colunas (p. ex., um “enter”). 3 * 5 

Uma abordagem alternativa, mais comum nas ciencias de bancada, e criar 
os metadados antes de os dados serem coletados. Uma boa parte do racioclnio 
claro pode acompanhar a exposi<;ao formal e a reda<;ao dos metodos, incluindo o 
delineamento amostral, o numero de observances previstas, o esparto amostral, e 
a organiza^ao do arquivo de dados. Tal construnao a priori dos metadados tam- 
bem facilita a redanao da se^ao de metodos do relatorio final ou da publicanao do 
estudo. Tambem apoiamos que graficos e tabelas sejam tra^ados para ilustrar as 
relates entre as variaveis que se pretende examinar. 

Independente de voce optar por escrever seus metadados antes ou apos a rea- 
lizanao do seu estudo, nao podemos exagerar sua importancia. Mesmo pensando 
que escrever os metadados consuma tempo e que eles pare^am conter informa- 
noes evidentes, garantimos que voce ira considera-los de valor inestimavel. Voce 
pode achar que nunca esquecera que “Charco Nemo” foi onde coletou os dados de 
sua obra-prima sobre orquideas amea^adas de extinnao. E e claro que ainda lem- 
brara de todas as estradas vicinais que percorreu ate chegar la. Mas o tempo ira 
corroer essas memorias conforme os meses e anos passam, e a medida que voce se 
envolver com novos projetos e estudos. 

Todos nos ja temos experiences de olhar listas de nomes em arquivos de com- 
putador (NEMO, NEMO03, NEMO03NOVO) tentando encontrar o que precisa- 
mos. Mesmo se pudermos encontrar o arquivo, ainda podemos estar sem sorte. 
Sem metadados, nao ha nenhuma maneira de recordar o significado da sopa de 
letrinhas das abreviaturas e siglas na linha superior do arquivo. Reconstruir con- 
juntos de dados e frustrante, ineficiente, consome tempo e impede a analise mais 
avan^ada dos dados. Conjuntos de dados nao documentados sao praticamente 
inuteis para voce e para qualquer pessoa. Dados sem os metadados nao podem ser 
armazenados em arquivos publicos acessiveis e nao tern vida util alem das estatis- 
ticas descritivas em uma publicanao ou um relatorio. 

0 SEGUNDO PASSO: ARMAZENAMENTO E CURADORIA DE DADOS 

Armazenamento: temporario e permanente 

Uma vez que os dados estao organizados e documentados, o conjunto de da¬ 
dos - uma combinanao de dados e metadados - deve ser armazenado em um 


3 Ecologos e cientistas da area ambiental estao desenvolvendo protocolos para metadados. Esses pro¬ 

tocols incluem o “Conteudo Padrao para Metadados Geoespaciais Digitais” ( Content Standards for 
Digital Geospatial Metadata; FGDC, 1998) para dados espacialmente organizados (p. ex., dados de 
Sistemas de Informa^ao Geografica ou SIG), descritores-padrao para dados ecologicos e ambientais 
de solos (Boone et al., 1999), e de classifica^ao e normas de informa^ao para dados que descrevem 
tipos de vegeta^ao (FGDC, 1997). Muitos desses protocolos foram incorporados na Linguagem Eco- 

logica de Metadados (ou EML, do ingles “Ecological Metadata Language”), desenvolvido no final de 
2002 (http://knb.ecoinformatics.org/software/eml/). 
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meio (ou midia) permanente. O sistema mais duravel, e o unico meio aceitavel 
como verdadeiramente permanente, e o papel livre de acidez. fi uma boa pra- 
tica imprimir uma copia da planilha de dados brutos, acompanhada de seus 
metadados, em papel livre de acidez usando uma impressora a laser!" Essa copia 
deve ser armazenada em algum lugar seguro contra danos. O armazenamento 
eletronico do conjunto de dados original tambem e uma boa ideia, mas voce 
nao deve esperar que as midias eletronicas durem mais que 5 a 10 anos.' Assim, 
o armazenamento eletronico deve ser usado principalmente para copias em uso. 
Se voce tiver a inten^ao de manter copias eletronicas por mais alguns anos, tera 
que copiar os conjuntos de dados para as novas midias eletronicas com regula- 
ridade. fi preciso reconhecer que o armazenamento de dados tern custos reais, 
de espa^o (onde os dados sao armazenados), de tempo (para manter e transferir 
conjuntos de dados entre as midias) e de dinheiro (porque o tempo e o espa^o 
valem muito). 

Curadoria de dados 

A maioria dos dados ecologicos e ambientais e coletada por pesquisadores 
usando recursos obtidos atraves de fmanciamentos e contratos. Em geral, es¬ 
ses dados pertencem tecnicamente a agenda financiadora, e eles devem estar 
disponiveis a terceiros dentro de um periodo de tempo razoavelmente curto. 
Desta forma, independente de como seus conjuntos de dados sao armazena¬ 
dos, devem ser mantidos de forma que os tornem usaveis nao so por voce, mas 
tambem pela ampla comunidade cientifica e por outros individuos ou grupos 
interessados. Como em museus e herbarios ou cole^oes de animais e plantas, 
os conjuntos de dados devem ser gerenciados para que estejam acessiveis a ou- 
tras pessoas. Varios conjuntos de dados gerados por um projeto ou grupo de 


b A tinta das impressoras matriciais antigas (e maquinas de escrever) dura mais que das impressoras 
jato-de-tinta, mas a liga^ao eletrostatica da tinta no papel das impressoras a laser tern durabilidade 
superior as demais. Os verdadeiros Luditas preferem a tinta Higgins® Aeterna India (em reverencia 
a Henry Horn). 
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Cartao perfurado de computador 


' Poucos leitores se lembrarao dos disquetes de qualquer tamanho 
(8”, 5-1/4” 3-1/2”), muito menos das fitas de papel, dos cartoes 
perfurados (ilustra^ao) ou dos rolos de fita magnetica. Enquan- 
to produzimos este livro, os onipresentes CD-ROMs estao sendo 
substituidos por DVDs, e provavelmente teremos que comprar 
nossas cole^oes de discos de vinil pela segunda vez em algumas 
decadas. Embora a vida util da maioria dos midias magneticas e 
da ordem de anos a decadas, e que a maioria dos meios opticos (CDs, DVDs) e da ordem de deca¬ 
das a seculos (apenas de anos nos tropicos umidos, onde fungos comem a cola entre as camadas de 
material laminado e estragam o disco), o mercado capitalista os substituem em um ciclo de aproxi- 
madamente 5 anos. Assim, embora ainda tenhamos em nossas prateleiras disquetes 5-1/4” legiveis 
com dados dos anos 1980’s e 1990’s, e quase impossivel encontrar em 2004, muito menos comprar, 
um leitor de disquetes para os ler. Mesmo se pudessemos encontrar um, os sistemas operacionais 
atuais dos nossos computadores nao irao reconhece-los como um equipamento periferico. Uma boa 
fonte de equipamentos e programas obsoletos e o “Computer History Museurn\ em Mountain View, 
California: http://www.computerhistory.org/. 
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pesquisa podem ser organizados em catalogos eletronicos de dados. Esses cata- 
logos muitas vezes podem ser acessados e pesquisados de localidades remotas 
usando a Internet. 

No momento em que escrevemos este livro, nao existem padroes estabeleci- 
dos para a curadoria de dados ecologicos e ambientais. A maioria dos catalogos 
de dados e mantida em servidores conectados a rede mundial de computadores 
(World Wide Web),* e pode ser encontrado usando as ferramentas de busca dis- 
poniveis. Assim como o armazenamento de dados, sua curadoria e cara: estima- 
-se que a gestao e a curadoria de dados devem consumir cerca de 20% do cus- 
to total de um projeto de pesquisa (Michener & Haddad, 1992). Infelizmente, 
embora as agendas financiadoras exijam que os dados sejam disponibilizados, 
elas tern sido relutantes em financiar os custos totais do gerenciamento e da 
curadoria de dados. Os proprios pesquisadores raras vezes or^am esses custos 
em seus pedidos de financiamento. Quando os o^amentos sao inevitavelmente 
cortados, os custos de gestao e curadoria de dados em geral sao os primeiros 
itens a ser descartados. 

0 TERCEIRO PASSO: VERIFICA(A0 DOS DADOS 

Antes de come^ar a analisar um conjunto de dados, voce deve examina-lo cuida- 
dosamente para detectar as discrepancias e os erros. 

A importance dos dados discrepantes 

Os dados discrepantes ( Outliers ) sao valores de medi^oes ou observances regis- 
tradas que estao fora do intervalo da maior parte dos dados (Figura 8.1). Embora 
nao exista um nivel padrao para “fora do intervalo” que defina um dado discre- 
pante, e uma pratica comum considerar valores alem do decil superior ou infe¬ 
rior (90° percentil, 10° percentil) de uma distribui<;ao como potenciais dados, e 


8 Muitos cientistas consideram que inserir dados na Internet e um meio de arquivamento per- 
manente de dados. Isso e ilusorio. Primeiro, isso e apenas uma transference de responsabilidade 
entre voce e um gestor de sistemas de informa^ao (ou outro profissional da area de tecnologia 
da informa^ao). Ao colocar sua copia de arquivos eletronica na Internet, voce espera que copias 
de seguran^a serao feitas com regularidade e mantidas pelo gestor do sistema. Cada vez que um 
servidor e aprimorado, os dados tern de ser copiados do antigo servidor para o novo. A maioria 
dos laboratorios ou departamentos nao tern seus proprios gestores de sistemas e os interesses 
dos centros de computa<;ao em arquivar e manter paginas e arquivos de dados na Internet nao 
sao necessariamente iguais aos dos investigadores. Segundo, os discos rigidos do servidor falham 
com frequencia (e muitas vezes espetacularmente). Por ultimo, a Internet nao e permanente nem 
estavel. GOPHER e LYNX desapareceram, FTP esta sendo substitulda por HTTP e HTML, e a lin- 
guagem atual da web ja esta sendo progressivamente abandonada em favor da (nao inteiramente 
compativel) XML. Todas essas altera^oes na funcionalidade da Internet e da acessibilidade dos 
arquivos armazenados ocorreram em 10 anos. Muitas vezes, e mais facil recuperar dados de cader- 
nos que foram escritos a mao no seculo XIX que os de sitios da Internet, que foram digitalmente 
“arquivados” na decada de 1990! 
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Figura 8.1 Histograma e box plot de amostras das medidas da altura de plantas-jarro carm'voras, 
Darlingtonia californica (tamanho amostral N = 25; dados da Tabela 8.1). 0 histograma mostra a 
frequencia das plantas em classes de tamanho com intervalos de 100 mm. Acima do histograma 
esta representado urn box plot dos mesmos dados. A linha vertical dentro da caixa indica a media- 
na da distribuigao. A caixa inclui 50% dos dados, e os"bigodes"abrangem 90%. A, B e C indicam os 
tres dados extremos e correspondem as linhas rotuladas na Tabela 8.1. Os histogramas e box plots 
permitem que voce identifique com rapidez os valores extremos de seus dados. 


aqueles menores do que o 5° percentil ou superior ao 95° percentil como possiveis 
valores extremos. Muitos pacotes estatisticos destacam esses valores em box plots 
(como fizemos com estrelas e letras na Figura 8.1) para indicar que voce deve 
examina-los com cuidado. Alguns desses pacotes tambem possuem ferramentas 
interativas, descritas na proxima se^ao, que permitem a localiza^ao desses valores 
dentro da planilha. 

E importante identificar dados discrepantes, pois eles podem ter efeitos dra- 
maticos sobre seus testes estatisticos. Dados discrepantes e valores extremos au- 
mentam a variancia dos dados. Variancias infladas diminuem o poder do teste e 
aumentam a possibilidade de erro Tipo II (falha em rejeitar uma hipotese nula 
falsa, ver Capitulo 4). Por essa razao, alguns pesquisadores excluem automati- 
camente dados discrepantes e valores extremos antes de realizar suas analises. 
Essa e uma pratica ruim! Existem apenas duas razCes justificaveis para descartar 
dados: (1) os dados estao errados (p. ex., eles foram anotados incorretamente no 
caderno de campo) e (2) os dados nao representam observances validas do seu 
espano amostral original (p. ex., uma de suas parcelas em dunas foi invadida por 
veiculos off-road). Excluir observances simplesmente porque elas sao “confusas” 
e a lavagem* ou adulteranao de resultados e, legitimamente, pode ser considera- 
da fraude cientifica. 

Os dados discrepantes sao mais do que apenas um ruido. Podem refletir pro¬ 
cesses biologicos reais e uma reflexao cuidadosa sobre o seu significado, levando a 


* N. de T. Do ingles laundering , e como “lavagem de dinheiro” 
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novas ideias e hipoteses. 9 Alem disso, alguns dados irao parecer discrepantes ape- 
nas porque estao sendo for<;ados a se ajustar a uma distribui<;ao normal. Os dados 
de distributees nao normais, como a log-normal ou a exponencial, muitas vezes 
parecem ser extremos, mas se adequam apos serem devidamente transformados 
(ver abaixo). 


Erros 

Os erros sao valores registrados que nao representam as medidas ou observances 
originais. Nem todos os erros sao dados discrepantes. Da mesma forma, nem 
todos os dados discrepantes necessariamente sao erros. Os erros podem aparecer 
no conjunto de dados de duas maneiras: como erros de coleta ou como de trans- 
crinao. No primeiro caso, sao dados que resultam de instrumentos quebrados ou 
descalibrados, ou da anota^ao errada de dados no campo. Alem disso, podem ser 
dificeis de identificar. Se voce ou seu assistente de campo estiverem anotando os 
dados e escreverem um valor incorreto, isto raramente podera ser corrigido. 10 
A menos que o erro seja reconhecido imediatamente durante a transcri^ao dos 
dados, caso contrario ele provavelmente nao sera detectado e contribuira para a 
varia^ao dos dados. 

Os erros resultantes de instrumentos quebrados ou descalibrados sao mais 
faceis de detectar (determina-se que o instrumento esta quebrado ou apos ele ser 


9 Embora os biologos sejam treinados para pensar em medianas e medias, e usar a estatistica 
para testar padroes de tendencia central dos dados, informa<;6es ecologicas e evolutivas inte- 
ressantes acontecem muitas vezes na cauda de uma distribui^ao estatistica. De fato, existe uma 
parte da estatistica dedicada ao estudo e a analise de valores extremos (Gaines & Denny, 1993), 
que podem ter impactos duradouros em ecossistemas (p. ex., Foster et al., 1998). Por exemplo, 
populates isoladas ( sensu Mayr, 1963), que resultam de um unico evento fundador, podem ser 
suficientemente distintas em sua composi^ao genetica, pois seriam estatisticamente consideradas 
dados discrepantes em rela^ao a popula^ao original. Tais populates isoladas, se sujeitas a novas 
pressoes seletivas, poderiam se tornar reprodutivamente isoladas de sua popula^ao original e 
formar novas especies (Schluter, 1996). As reconstru^oes filogeneticas sugerem que populates 
isoladas podem resultar em novas especies (p. ex., Green et al., 2002), mas testes experimentais 
da teoria nao apoiaram o modelo de especia^ao pelo efeito do fundador e populates isoladas 
(Mooers et al., 1999). 

10 Para minimizar erros de coleta no campo, muitas vezes nos envolvemos em um tipo de dialogo de 
perguntas e respostas entre nos e nossos assistentes de campo: 

Coletor de dados: “Esta e a planta 107. Ela tem 4folhas y nao tern fdodios, nao temflores” 

Anotador dos dados: “Certo , 4folhas y sem filodios e semflores para a 107 ” 

Coletor de dados: “Onde esta a 108?” 

Anotador dos dados: “Morreu no ano passado. A 109 deve estar cerca de 10 metros a sua esquer- 
da. No ano passado ela tinha 7 folhas e umaflor atrofiada. Depois da 109 y deve ter apenas mais 
uma planta nesta parcela” 

Repetir as observa^oes passadas de um para o outro e manter um controle cuidadoso das in- 
forma^oes ajuda a minimizar os erros de coleta. Esta u conversa sobre dados” tambem nos mantem 
atentos e concentrados durante longos dias de campo. 
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recalibrado). Infelizmente, o erro do instrumento pode resultar na perda de uma 
grande quantidade de dados. Experimentos que dependem da coleta automatiza- 
da de dados necessitam de procedimentos adicionais para checagem e manuten- 
910 de equipamentos, minimizando, com isso, a perda de dados. Pode ser possivel 
coletar valores de reposi^ao para dados que resultam de falhas de equipamento, 
mas apenas se as falhas forem detectadas logo apos a coleta. As possiveis falhas 
de equipamentos sao outra razao para transcrever logo seus dados brutos para as 
planilhas e avaliar a sua acuracia. 

Os erros de transcri^ao resultam principalmente de ma digita^ao dos valores 
nas planilhas. Quando esses erros parecerem discrepancias, podem ser conferi- 
dos com as fichas de campo originais. Provavelmente, o erro de transcri^ao mais 
comum e colocar a virgula decimal fora de lugar, alterando a ordem de grandeza 
do valor. Quando os erros de transcri^ao nao aparecem como dados discrepantes, 
podem permanecer nao detectados, a menos que as planilhas sejam conferidas 
com cuidado. Os erros na transcri<;ao sao menos comuns quando os dados dos 
instrumentos sao transferidos eletronicamente direto para as planilhas. No en- 
tanto, podem ocorrer erros de transmissao, que podem resultar em erros de “des- 
locamento de estrutura”, nos quais um valor colocado na coluna errada resulta no 
deslocamento de todos os valores subsequentes para colunas incorretas. A maioria 
dos instrumentos possui programas para checar erros de transmissao e relata-los 
ao usuario em tempo real. Os arquivos de dados originais procedentes de instru¬ 
mentos de coleta automatizada de dados nunca devem ser apagados da memoria 
do instrumento ate que as planilhas tenham sido conferidas com cautela. 

Dados faltantes 

Um problema relacionado, e igualmente importante, e o tratamento de dados 
faltantes (missing values). Seja muito cuidadoso em suas planilhas e em seus me¬ 
tadados para distinguir os valores medidos como 0 dos dados faltantes (replicas 
em que nenhuma observa^o foi registrada). Os dados faltantes em uma planilha 
devem receber uma designa^o propria (como a sigla “ND*” para “nao disponi- 
vel”) em vez de deixar as celulas em branco. Isso merece cuidado, pois alguns pro¬ 
gramas podem tratar as celulas em branco como zeros (ou inserir “ 0 ” nos espa<;os 
em branco), o que ira arruinar a sua analise. 

Detectando discrepancias e erros 

Encontramos tres tecnicas especialmente uteis para detectar dados discrepantes e 
erros em conjuntos de dados: calcular estatisticas de colunas, checar os intervalos 
e a precisao dos valores das colunas, e analisar dados de maneira exploratoria 
com graficos. Outros metodos mais complexos foram discutidos por Edwards 
(2000). Usamos como exemplo para detec^ao de discrepancias a medida das 


* N. de T. A sigla depende do programa que for utilizar e, em geral, emprega-se a em ingles (NA para 
not available). 
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alturas das folhas-jarro da Darlingtonia californica (llrio-cobra, ou planta-jarro 
da California). 11 Coletamos esses dados, apresentados na Tabela 8.1, como parte 
de um estudo de crescimento, alometria e fotossintese dessa especie. Neste exem- 
plo com apenas 25 observances, os dados discrepantes sao faceis de detectar, sim- 
plesmente olhando as colunas de numeros. Entretanto, a maioria dos conjuntos 
de dados ecologicos tera muito mais observances e sera mais dificil encontrar 
valores incomuns no arquivo de dados. 

EstatIsticas de coluna O calculo de estatisticas de coluna simples dentro da 
planilha e uma maneira facil de identifkar valores inusitadamente grandes ou 
pequenos no conjunto de dados. As medidas de posinao e dispersao, como media, 
mediana, desvio-padrao e variancia das colunas, dao uma visao geral e rapida 
da distribuinao dos valores nas colunas. Os valores minimo e maximo em uma 
coluna podem indicar resultados grandes ou pequenos. A maioria dos programas 
de planilhas eletronicas possui funnoes que calculam esses valores. Se inserir essas 
funnoes nas seis ultimas linhas da planilha (Tabela 8.1), voce podera usa-las como 
uma primeira checagem dos dados. Se encontrar um valor extremo e determi- 
nar que e um erro verdadeiro, a planilha atualizara automaticamente os calculos 
quando voce substituir o valor pelo numero correto. 

Checando o intervalo e a precisAo dos valores das colunas Outra forma de 
verificar os dados e usar as funnoes das planilhas para assegurar que os valores em 
uma determinada coluna estao dentro de limites razoaveis ou se refletem a preci- 
sao das medidas. Por exemplo, os jarros de Darlingtonia raras vezes ultrapassam 
os 900 mm de altura. Qualquer medida muito acima desse valor seria suspeita. 
Poderiamos olhar com atennao o conjunto de dados para ver se quaisquer valores 
sao extremamente grandes, porem, para conjuntos de dados reais, com centenas 
ou milhares de observances, a verificanao manual e ineficiente e sem acuracia. A 
maioria dos programas de planilhas eletronicas tern funnoes logicas que podem 
ser utilizadas para checagem de valores e automatizanao do processo. Desse modo, 
voce poderia usar a declaranao: 

Se (valor a ser conferido) > (um valor maximo), registre um “1”; caso contrario, 
registre “0” para verificar rapidamente se qualquer valor de altura excede um li- 
mite superior (ou inferior). 



Darlingtonia californica 


n A Darlingtonia californica e uma planta carnivora da familia 
Sarraceniaceae que cresce apenas nos charcos {“serpentine fens”) 
das montanhas Siskiyou em Oregon e California e nas monta- 
nhas de Sierra Nevada na California. Suas folhas em forma de 
jarro normalmente atingem 800 mm de altura, mas as vezes pas- 
sam de 1 m. Essas plantas alimentam principalmente de formigas, 
moscas e vespas. 
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TABELA 8.1 Conjunto de dados ecologicos ilustrando valores 
extremos tipicos para Darlingtonia californica 



Planta # 

Altura 

Boca 

Tubo 


i 

744 

34,3 

18,6 


2 

700 

34,4 

20,9 


3 

714 

28,9 

19,7 


4 

667 

32,4 

19,5 


5 

600 

29,1 

17,5 


6 

777 

33,4 

21,1 


7 

640 

34,5 

18,6 


8 

440 

29,4 

18,4 


9 

715 

39,5 

19,7 


10 

573 

33,0 

15,8 

A 

11 

1.500 

33,8 

19,1 


12 

650 

36,3 

20,2 


13 

480 

27,0 

18,1 


14 

545 

30,3 

17,3 


15 

845 

37,3 

19,3 


16 

560 

42,1 

14,6 


17 

450 

31,2 

20,6 


18 

600 

34,6 

17,1 


19 

607 

33,5 

14,8 


20 

675 

31,4 

16,3 


21 

550 

29,4 

17,6 

B 

22 

5,1 

0,3 

0,1 


23 

534 

30,2 

16,5 


24 

655 

35,8 

15,7 

C 

25 

65,5 

3,52 

1,77 

Media 


611,7 

30,6 

16,8 

Mediana 


607 

33,0 

18,1 

Desvio-Padrao 


265,1 

9,3 

5,1 

Variancia 


70.271 

86,8 

26,1 

Minimo 


5,1 

0,3 

0,1 

Maximo 


1.500 

42,1 

21,1 


Os dados sao medidas morfologicas de individuos de plantas-jarro. A altura do jarro (em mm), o diametro 
da boca do jarro (em mm) e o diametro do tubo do jarro (em mm) foram registrados para 25 individuos 
amostrados em Days Gulch. As linhas com valores extremos na Figura 8.1 estao real^adas em negrito e de- 
signadas como A, B e C. Estatisticas descritivas para cada variavel estao na parte inferior da tabela. E crucial 
identificar e avaliar os valores extremos em um conjunto de dados. Tais valores aumentam muito a esti- 
mativa da variancia, e e importante averiguar se essas observances representam erros de medidas, medidas 
atipicas ou apenas a varianao natural da amostra. 
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Este mesmo metodo pode ser usado para conferir a precisao dos valores. Me- 
dimos a altura utilizando uma fita metrica com marca^des em milimetros, e, por 
costume, arredondamos para o milimetro mais proximo. Assim, nenhum valor 
na planilha deve ser mais preciso que um milimetro (i. e., nenhum valor deve ter 
frames de milimetros). A fun^ao logica para checar isso e: 

Se (o valor a ser conferido tiver qualquer outro que nao um 0 
depois da virgula decimal), registre um “1”; caso contrario, registre “0”. 

Voce pode imaginar diversas formas similares para checar os valores em co- 
lunas, e a maioria pode ser automatizada, utilizando fun^oes logicas dentro de 
planilhas eletronicas. 

A checagem do intervalo dos dados da Tabela 8.1 revela que a altura registra- 
da para a planta 11 (1.500 mm) e suspeita, pois essa observa^ao excede o limite 
de 900 mm. Alem disso, as alturas registradas para a planta 22 (5,1 mm) e para a 
planta 25 (65,5 mm) foram digitadas erroneamente, pois os valores decimals sao 
maiores que a precisao das nossas fitas metricas. Esta auditoria poderia nos levar 
a re-examinar nossos dados nas fichas de campo ou, talvez, voltar ao campo para 
medir as plantas novamente. 

AnAlise de dados grAfica exploratoria As figuras cientificas - graficos - sao 
uma das ferramentas mais poderosas que voce pode usar para descrever os re- 
sultados de seu estudo (Tufte, 1986, 1990; Cleveland, 1985, 1993). Eles tam- 
bem podem ser usados para detectar erros e discrepancias, e para evidenciar 
padroes inesperados nos seus dados. A utiliza^ao de graficos antes da analise 
formal dos dados e chamada de analise de dados grafica exploratoria ou gra¬ 
ficos EDA*, ou simplesmente EDA (p. ex., Tukey, 1977; Ellison, 2001). Aqui, 
concentramo-nos no uso da EDA para a detec<;ao de dados discrepantes e valo¬ 
res extremos. O uso da EDA para procurar por padroes, novos ou inesperados, 
nos dados (“mineraqao de dados” ou, mais pejorativamente, “garimpagem ou 
dragagem de dados”) esta evoluindo em sua propria industria artesanal (Smith 
8c Ebrahim, 2002). 12 


12 A obje^ao estatistica a dragagem de dados e que se fizermos bastante graficos a partir de um con- 
junto de dados grande e complexo, certamente iremos encontrar algumas relates que pare^am 
estatisticamente significativas. Assim, a dragagem de dados debilita nosso calculo dos valores de 
P e aumenta as chances de rejeitarmos incorretamente a hipotese nula (erro Tipo I). A obje^ao 
filosofica a EDA e que voce ja deve saber de antemao como seus dados serao plotados e analisados. 
Como enfatizamos nos Capitulos 6 e 7, a defini^ao previa do delineamento amostral e das analises 
caminha lado a lado com uma questao de pesquisa bem focada. Por outro lado, a EDA e essencial 
para a detec^ao de valores discrepantes e erros. Nao ha como negar que voce pode revelar padroes 
interessantes apenas casualmente, plotando seus dados. Voce sempre pode voltar ao campo para 
testar esses padroes com um delineamento experimental apropriado. Bons programas estatisticos 
facilitam analises EDA, porque os graficos podem ser construidos com rapidez e facilmente visuali- 
zados na tela do computador. 

* N. de T. EDA e a abrevia^ao, em ingles, para Exploratory Data Analysis (analise de dados explo¬ 
ratoria). 
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Figura 8.2 Grafico de caule-e-folha. Os dados sao medidas da altura (em mm) de 25 indivi'duos 
de Darlingtonia californica (Tabela 8.1). Neste grafico, a primeira coluna de numeros a esquerda 
- o"caule"— representa a casa das"centenas"e cada"folha", a direita, a casa das"dezenas"de cada 
valor registrado. Por exemplo, a primeira linha ilustra as observances OOx e 06x, ou uma observagao 
menorque 10 (o valor de 5,1 da planta 22, na Tabela 8.1), e outra observanao entre 60 e 70 (o valor 
de 65,5 da planta 25). A quinta linha ilustra as observances 44x, 45x e 48x, que correspondem a va- 
lores de 440 (planta 48), 450 (planta 17) e 480 (planta 13). A ultima linha ilustra a observanao 150x, 
correspondente ao valor 1.500 (planta 11).Todasas observances contidas na coluna 1 da Tabela 
8.1 estao indufdas nessa representanao. A mediana (607) esta na linha 7, indicada com a letra M. O 
quartil inferior (545), tambem conhecido como dobradina, esta na linha 6, indicado com a letra D. 
O quartil superior ou dobradina (700) esta na linha 8, tambem marcado com a letra D. Da mesma 
forma que histogramas e box plots, graficos de caule-e-folha sao uma ferramenta de diagnostico 
para visualizar seus dados e detectar dados extremos. 


Existem tres tipos de graficos indispensaveis para detectar dados discrepantes 
e valores extremos: box plots, graficos de caule-e-folha e graficos de dispersao. 
Os dois primeiros sao melhores para dados univariados (plotar a distribuinao de 
uma unica variavel), enquanto os graficos de dispersao sao utilizados para da¬ 
dos bivariados ou multivariados (plotar as relates entre duas ou mais variaveis). 
Voce ja viu muitos exemplos de dados univariados neste livro: as 50 observances 
do comprimento do espinho tibial de aranhas (ver Figura 2.6 e Tabela 3.1), a pre¬ 
senna ou ausencia de Rhexia em municipios de Massachusetts (Capitulo 2), e a 
taxa reprodutiva do besouro girinideo de manchas na cor laranja (Capitulo 1) sao 
todos os conjuntos de medidas de uma unica variavel. Para ilustrar a detecnao de 
dados discrepantes e graficos univariados de EDA, usamos a primeira coluna de 
dados da Tabela 8.1 - altura do jarro. 

Nossas estatisticas descritivas na Tabela 8.1 sugerem que podem haver alguns 
problemas com os dados. A variancia e grande em relanao a media, e tanto o valor 
minimo quanto o maximo parecem extremos. Um box plot (no topo da Figura 
8.1) mostra que dois pontos sao inusitadamente pequenos e um ponto e bastante 
grande. Podemos identificar esses valores inusitados em mais detalhes com um 
grafico de caule-e-folha (Figura 8.2), que e uma variante do familiar histograma 
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(Capitulo 1; Tukey, 1977). O grafico de caule-e-folha mostra claramente que os 
dois valores pequenos sao de uma ordem de grandeza (i. e., cerca de dez vezes) 
menor que a media ou que a mediana, e que o valor grande e mais do que o dobro 
da media ou da mediana. 

Quao inusitados sao esses valores? Sabe-se que alguns jarros de Darlingto- 
nia excedem um metro de altura, e jarros muito pequenos tambem podem ser 
encontrados. Talvez essas tres observances simplesmente reflitam a variabilidade 
inerente ao tamanho dos jarros do lxrio-cobra. Sem informa^oes adicionais, nao 
ha razao para pensar que estao errados, ou que nao sejam parte do nosso espa^o 
amostral, e seria inapropriado remove-los do conjunto de dados antes das analises 
estatisticas posteriores. 

No entanto, ainda temos informa^oes adicionais. A Tabela 8.1 mostra outras 
duas medidas que fizemos a partir dos mesmos jarros: o diametro do tubo do 
jarro e o da abertura da boca do jarro. Poderiamos esperar que todas essas varia- 
veis tivessem rela<;ao umas com as outras, tanto por causa de pesquisas anterio- 
res sobre Darlingtonia (Franck, 1976) quanto porque o crescimento de partes das 
plantas (e animais) tende a ser correlacionado (Niklas, 1994). 13 Uma forma rapida 
de explorar como essas variaveis covariam umas com as outras e plotar todas as 
relates entre os pares possiveis (Figura 8.3). 

A matriz de graficos de dispersao mostrada na Figura 8.3 fornece infor- 
ma^ao adicional com as quais decide se nossos valores inusitados sao discre- 
pantes. Os dois graficos de dispersao na linha superior da Figura 8.3 sugerem 
que a planta inusitadamente alta na Tabela 8.1 (ponto A; planta 11) tambem 
e alta em rela<;ao aos seus diametros do tubo e da boca do jarro. Porem, os 


'"Imagine um grafico no qual voce plotou o logaritmo do comprimento do jarro no eixo-x e o do 
diametro do tubo no eixo-y. Esse tipo de rela^ao alometrica revela o modo com que a forma de um 
organismo pode mudar com seu tamanho. Suponha que lirios-cobra pequenos sao replicas perfeitas 
em escala reduzida de lirios-cobra grandes. Neste caso, o aumento no diametro do tubo e sincronico 
com o aumento do comprimento jarro, e a inclina^ao da reta ((3j) = 1 (ver Capitulo 9). O crescimento 
e isometrico e as plantas pequenas parecem miniaturas das grandes. Por outro lado, suponha que 
jarros pequenos tenham diametros do tubo que sao relativa, mas nao absolutamente maiores que os 
do tubo de plantas maiores. Conforme as plantas crescem em tamanho, os diametros do tubo crescem 
relativamente menos em compara^ao ao comprimento dos jarros. Esse seria um caso de alometria 
negativa e resultaria em um valor de inclina^ao (3, < 1. Por fin, se ha alometria positiva, o diametro do 
tubo aumenta mais rapido com o aumento do comprimento do jarro ((3, > 1). Esses padroes foram 
ilustrados por Franck (1976). Um exemplo mais conhecido e o do bebe humano, que nasce com uma 
cabe^a relativamente grande, mas seu corpo cresce aos poucos e depois apresenta alometria negativa. 
Outras partes do corpo, como os dedos dos pes e das maos, apresentam alometria positiva e crescem 
um pouco mais rapido. 

O crescimento alometrico (positivo ou negativo) e a regra na natureza. Poucos organismos 
crescem isometricamente com jovens parecendo replicas em miniatura dos adultos. Organismos 
mudam de forma a medida que crescem, em parte por limita^oes flsiologicas basicas do meta- 
bolismo e da absor^ao de materiais. Imagine que (simplificadamente) a forma de um organismo 
seja um cubo com um lado de comprimento L. O problema e que, conforme os organismos au- 
mentam de tamanho, o volume aumenta em uma fun<^ao cubica (I 3 ) do comprimento (L), mas 
a area da superficie aumenta apenas como uma fun^ao quadrada (L 2 ). As demandas metabolicas 


( Continua ) 
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Figura 8.3 Matriz de graficos de dispersao ilustrando a relagao entre altura, diametro da boca e diametro 
do tubo de 25 individuos de D. californica (Tabela 8.1). Os valores extremos rotulados na Figura 8.1 e na Tabela 
8.1 tambem estao rotulados aqui. Os paineis da diagonal nesta figura ilustram os histogramas para cada uma 
das 3 variaveis morfologicas. Nos paineis fora da diagonal, os graficos de dispersao ilustram a rela^ao entre as 
duas variaveis indicadas na diagonal; os graficos de dispersao acima da diagonal sao imagens-espelho daquelas 
abaixo da diagonal. Por exemplo, o grafico de dispersao no canto inferior esquerdo ilustra a rela^ao entre a 
altura do jarro (no eixo-x) e o diametro do tubo (no eixo-y), enquanto o de dispersao, no canto superior direito, 
mostra a rela^ao entre o diametro do tubo (no eixo-x) e a altura do jarro (no eixo-y). As linhas em cada grafico 
de dispersao representam o melhor ajuste da regressao linear entre as duas variaveis (ver Capitulo 9 para mais 
detalhes sobre regressao linear). 


13 (Continua$ao) 

de um organismo sao proporcionais ao volume (I 3 ), mas a transferencia de material (oxigenio, 
nutrientes, produtos residuais) e proporcional a superficie (I 2 ). Portanto, as estruturas que fiincio- 
nam bem para a transferencia de material em pequenos organismos nao funcionarao tao bem em 
organismos maiores. Isto fica especialmente evidente quando comparamos especies com tamanho 
do corpo muito diferente. Por exemplo, a membrana da celula de um microrganismo faz um bom 
trabalho transferindo oxigenio por difusao simples, mas um rato ou um ser humano precisam de 
um pulmao vascularizado, um sistema circulatorio e uma molecula de transporte especializada 
(hemoglobina) para realizar a mesma tarefa. Dentro e entre especies, os padroes de forma, tama¬ 
nho e morfologia muitas vezes refletem a necessidade de aumentar a area da superficie para atender 
as demandas fisiologicas do aumento do volume. Ver Gould (1977) para uma discussao detalhada 
sobre o significado evolutivo do crescimento alometrico. 
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graficos de diametro da boca versus o diametro do tubo do jarro mostram que 
nenhuma dessas medidas sao inusitadas para a planta 11. Coletivamente, esses 
resultados sugerem um erro - ou ao registrar a altura da planta no campo ou 
na transcriqao de sua altura - a partir da folha de dados de campo para a pla- 
nilha de computador. 

Em contraste, as plantas pequenas nao sao inusitadas em nenhum aspecto, 
exceto por serem pequenas. Elas nao so sao pequenas como tambem tern tubos e 
bocas diminutas. Se removermos a planta 11 (a inusitadamente alta) do conjunto 
de dados (Figura 8.4), as relates entre todas as tres variaveis das plantas peque¬ 
nas nao serao inusitadas em rela^ao ao resto da popula^ao, e nao havera nenhuma 
razao com base nos proprios dados para suspeitar que os valores dessas plantas 


0 10 20 30 40 



Figura 8.4 Matriz de graficos de dispersao ilustrando a rela^ao entre altura, diametro da boca e diametro 
do tubo. Os dados e a organiza^ao grafica e a mesma da Figura 8.3. No entanto, o ponto A discrepante (Ta- 
bela 8.1) foi eliminado, o que muda algumas dessas relates. Como esse ponto era uma grande diferen^a 
na altura dos jarros (altura = 1500 mm), a escala dessa variavel (eixo-x na coluna da esquerda) agora varia 
apenas de 0 a 800 mm, em comparaqao com 0 a 1500 mm na Figura 8.3. Nao e incomum encontrar mudan- 
$as em correlates e valores de significance estati'stica com base na inclusao ou exclusao de um unico dado 
com valor extremo. 
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foram digitados incorretamente. No entanto, essas duas plantas sao muito peque- 
nas (realmente poderiamos ter medido uma planta com 5 milimetros de altura?), 
motivo pelo qual devemos conferir as nossas fichas de campo e, talvez, voltar ao 
campo para remedir essas plantas. 

Criando um rastro de auditoria 

O processo de exame de um conjunto de dados para encontrar erros e dados dis- 
crepantes e um caso especial de um processo generico de garantia de qualidade 
e controle de qualidade (abreviado como GQ/CQ). Como em todas as opera¬ 
tes, em uma planilha ou em conjunto de dados, os metodos utilizados para 
detecto de erros e dados discrepantes devem ser documentados em uma se«;ao 
de GQ/CQ nos metadados. Se for necessario remover dados da planilha, uma 
descri^ao dos valores removidos deve ser incluida nos metadados e uma nova 
planilha deve ser criada, contendo os dados corrigidos. Essa planilha tambem 
deve ser armazenada em midia permanente com uma identifica^ao exclusiva no 
catalogo de dados. 

O processo de submeter dados a uma GQ/CQ e de modificar os arquivos de 
dados leva a cria^ao de um rastro de auditoria dos dados. Trata-se de uma serie 
de arquivos e de sua documenta^ao associada que permitem a outros usuarios 
recriar o processo pelo qual o conjunto de dados final foi analisado. O rastro de 
auditoria e uma parte necessaria dos metadados em qualquer estudo. Se voce esta 
preparando um relatorio de impacto ambiental ou outro documento utilizado 
em processos legais, o rastro de auditoria dos dados pode ser parte das evidencias 
legais que apoiam o caso. 14 

0 PASSO FINAL: TRANSFORMA^AO DE DADOS 

Muitas vezes voce ira ler em um artigo cientifico que os dados foram “transfor- 
mados antes das analises”. Apos a transforma<;ao, os dados “atenderam aos pres- 
supostos” do teste estatistico utilizado e a analise foi executada. Em geral, pouca 
coisa e dita sobre as transformates de dados, e voce pode perguntar-se porque os 
dados foram transformados. 

Mas, primeiro, o que e uma transforma^ao? Uma transforma^ao significa 
simplesmente que uma funnao matematica foi aplicada a todas as observances de 
uma dada variavel: 


14 Os historiadores da ciencia tern reconstruido o desenvolvimento de teorias cientificas, pelo estudo 
cuidadoso de rastros de auditoria negligenciados - anota^oes marginais rabiscadas de sucessivos 
rascunhos de manuscritos e em diferentes edi<;6es de monografias. O uso de processadores de texto 
e planilhas eliminou as anota^oes marginais e os grifos, mas permitiu a cria^ao e a manuten^ao de 
rastros de auditoria formais. Outros usuarios dos seus dados e futuros historiadores da ciencia irao 
agradecer por voce manter um rastro de auditoria em seus dados. 




242 Nicholas J. Gotelli e Aaron M. Ellison 


Y*=f(Y) 


( 8 . 1 ) 


O Y representa a variavel original; o Y*, a variavel transformada, e /e uma 
fun^ao matematica aplicada aos dados. A maioria das transforma 9 oes correspon- 
de a fu^oes algebricas simples, sujeitas simplesmente a exigencia de que sejam 
fun9oes monotonas contmuas.'^ Por serem monotonas, as transforma 9 oes nao 
alteram a ordena 9 ao dos dados, mas mudam o espa 9 amento relativo entre os pon- 
tos de dados e, portanto, afetam a variancia e a forma da distribu^ao de probabi- 
lidades (Capitulo 2 ). 

Ha duas razoes legitimas para transformar seus dados antes das analises. 
Primeiro, as transforma 9 oes podem ser uteis (embora nao estritamente necessa- 
rias), pois os padroes nos dados transformados podem ser mais faceis de com- 
preender e comunicar do que os nos dados brutos. Segundo, transforma 9 oes 
podem ser necessarias para que a analise seja valida - este e o “atenderam aos 
pressupostos” usado com maior frequencia em artigos cientificos e discutidos 
nos livros de biometria. 

Transforma^oes de dados como ferramenta cognitiva 

As transforma 9 oes muitas vezes sao uteis para converter curvas em linhas retas. 
Conceitualmente, redoes lineares sao mais faceis de entender e muitas vezes 
tern melhores propriedades estatisticas (ver Capitulo 9). Quando duas variaveis 
sao relacionadas uma com a outra por fu^oes multiplicativas ou exponenciais, 
a transforma 9 ao logaritmica e uma das transforma 9 oes de dados mais uteis (ver 
Nota de rodape 13). Um exemplo ecologico classico e a rela 9 ao especie-area: a re- 
la 9 ao entre o numero de especies e a area de ilhas ou de amostras (Preston, 1962; 
MacArthur & Wilson, 1967). Se medirmos o numero de especies em uma ilha e 
plotarmos contra a area da ilha, os dados com frequencia seguem uma fun9ao de 
potencia simples: 


S = cA z (8.2) 

Onde Seo numero de especies, A e a area da ilha, e c e z sao constantes 
ajustadas aos dados. Por exemplo, o numero de especies de plantas encontradas 
em cada uma das ilhas de Galapagos (Preston, 1962) parece seguir uma rela 9 ao 
assintotica (Tabela 8 . 2 ). Primeiro, observe que a area das ilhas varia mais de tres 
ordens de grandeza, de menos de 1 a cerca de 7.500 km 2 . Da mesma forma, o 
numero de especies varia em duas ordens de magnitude, de 7 a 325. 


15 Uma fun^ao continua e uma fun^ao/QO tal que para quaisquer dois valores de uma variavel alea- 
toria X, x j e x jy que diferem por um numero muito pequeno (|x, - x-\ < 8), entao [f(x { ) -/(*,) | < £, 
outro numero muito pequeno. Uma fun^ao monotona e uma fun$ao/(X) tal que para quaisquer dois 
valores da variavel aleatoria X, x { e x-, se x { < x ; entao/(x,) < f(Xj). Uma fun^ao monotona continua 
possui essas duas propriedades. 
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TABELA 8.2 Riqueza de especies em 17 ilhas de Galapagos 


Ilha 

Area (km 2 ) 

N^de 

especies 

log l0 (area) 

log 10 (especies) 

Albemarle (Isabela) 

5.824,9 

325 

3,765 

2,512 

Charles (Floreana) 

165,8 

319 

2,219 

2,504 

Chatham (San Cristobal) 

505,1 

306 

2,703 

2,486 

James (Santiago) 

525,8 

224 

2,721 

2,350 

Indefatigable (Santa Cruz) 

1.007,5 

193 

3,003 

2,286 

Abingdon (Pinta) 

51,8 

119 

1,714 

2,076 

Duncan (Pinzon) 

18,4 

103 

1,265 

2,013 

Narborough (Fernandina) 

634,6 

80 

2,802 

1,903 

Hood (Espanola) 

46,6 

79 

1,669 

1,898 

Seymour 

2,6 

52 

0,413 

1,716 

Barringon (Santa Fe) 

19,4 

48 

1,288 

1,681 

Gardner 0.5 

48 

-0,286 

1,681 


Bindloe (Marchena) 

116,6 

47 

2,066 

1,672 

Jervis (Rabida) 

4,8 

42 

0,685 

1,623 

Tower (Genovesa) 

11,4 

22 

1,057 

1,342 

Wenman (Wolf) 

4,7 

14 

0,669 

1,146 

Culpepper (Darwin) 

2,3 

7 

0,368 

0,845 

Media 

526,0 

119,3 

1,654 

1,867 

Desvio-Padrao 

1.396,9 

110,7 

1,113 

0,481 

Erro-Padrao da Media 

338,8 

26,8 

0,270 

0,012 


A area (originalmente apresentada em milhas quadradas) foi convertida para quilometros quadrados e 
os nomes das ilhas usados por Preston (1962) foram mantidos, com os nomes modernos das ilhas apre- 
sentados entre parenteses. As duas ultimas colunas mostram o logaritmo da area e da riqueza de especies, 
respectivamente. Transforma^oes matematicas, como as logaritmicas, sao usadas para atender melhor os 
pressupostos de analises parametricas (normalidade, linearidade e variancias constantes) e elas sao usadas 
como uma ferramenta de diagnostico para auxiliar na identifica^ao de dados discrepantes e valores extre- 
mos. Como a variavel resposta (riqueza de especies) e a variavel preditora (area da ilha) foram medidas em 
uma escala continua, um modelo de regressao foi usado para a analise (ver Tabela 7.1). 


Se plotarmos os dados brutos - o numero de especies S em fun^ao da area A 
(Figura 8.5) —, veremos que a maioria dos pontos esta agrupada a esquerda da 
figura (pois a maioria das ilhas sao pequenas). Como um primeiro passo para a 
analise, poderiamos tentar ajustar uma linha reta para essa rela^ao: 

s = p 0 + M (8.3) 
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Figura 8.5 Grafico da riqueza de especies vegetais em fungao da area de ilhas de Galapagos 
utilizando os dados brutos (Colunas 2 e 3) da Tabela 8.2. A linha mostra o melhor ajuste da reta de 
regressao linear (ver Capi'tulo 9). Embora uma regressao linear possa ser ajustada para qualquer par 
de variaveis continuas, o ajuste linear para esses dados nao e bom: existem muitos dados discre- 
pantes negativos nas ilhas pequenas, e a indina^ao da reta e dominada pelos dados de Albermarle, 
a maior ilha do conjunto de dados. Em muitos casos, uma transforma^ao matematica da variavel X, 
da variavel Y, ou de ambas ira melhorar o ajuste de uma regressao linear. 


Neste caso, (3 0 representa o intercepto da linha e (3,, sua inclina^ao (ver Ca- 
pitulo 9). No entanto, a linha nao se ajusta muito bem aos dados. Em par¬ 
ticular, observe que a inclina^ao da linha de regressao parece ser dominada 
pelos dados de Albermarle, a maior ilha do conjunto de dados. No Capitulo 7, 
alertamos precisamente para esse problema, que pode aparecer quando dados 
discrepantes dominam o ajuste de uma linha de regressao (Figura 7.3). O ajuste 
da linha aos dados nao captura bem a rela^ao entre a riqueza de especies e a 
area das ilhas. 

Se a riqueza de especies e a area das ilhas estao relacionadas exponencialmen- 
te (Equa^ao 8.2), transformaremos essa equaqio tirando os logaritmos em ambos 
os lados: 


log(S) = log( cA z ) 


(8.4) 


log(S) = log(c) + zlog(A) 


(8.5) 


Essa transforma 9 ao tira vantagem de duas propriedades dos logaritmos. Primei- 
ro, o logaritmo de um produto de dois numeros e igual a soma de seus logaritmos: 
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log(afc) = log(fl) + log(f>) 

(8.6) 

Segundo, o logaritmo de um numero elevado a uma potencia e igual a poten- 
cia multiplicada pelo logaritmo do numero: 

log (a b ) = Mog(a) 

(8.7) 

Podemos reescrever a Equa<;ao 8.4, representando 

os valores transformados 

logaritmicamente com o simbolo *: 


S* = c*+ zA* 

(8.8) 


Assim, tomamos uma equa^ao exponencial (Equa<;ao 8.2) e a transforma- 
mos em uma equa<;ao linear (Equa^ao 8.8). Quando plotamos o logaritmo dos 
dados, a rela^ao entre riqueza de especies e a area das ilhas agora e muito mais 
clara (Figura 8.6) e os coeficientes tern uma interpreta<;ao simples. O valor de 
z nas Equates 8.2 e 8.8, que equivale a inclina^ao da linha na Figura 8.6, e de 
0,331. Isso significa que, aumentando A* (o logaritmo da area da ilha) em uma 
unidade (ou seja, por um fator de 10 vezes, ja que usamos o log 10 para trans- 
formar nossas variaveis na Tabela 8.2, e 10 1 = 10), aumentamos a riqueza de 
especies em 0,331 unidades (ou seja, por um fator de aproximadamente 2, pois 
10°.33! ^ jg Ua j a 2,14). Assim, podemos dizer que um aumento de 10 vezes na area 



log 10 (area da ilha) 

Figura 8.6 Grafico do logaritmo da riqueza de especies de plantas em fun^ao do logaritmo da area 
das ilhas de Galapagos (Colunas 4 e 5 da Tabela 8.2). A reta e a linha de regressao com melhor ajuste 
(irerCapi'tulo 9). Comparada com o grafico da Figura 8.5, essa regressao se ajusta aos dados: a maior 
ilha do conjunto de dados nao parece mais uma discrepancy e a linearidade do ajuste e melhor. 
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das ilhas resulta em uma duplica^ao do numero de especies presentes nas ilhas 
de Galapagos.' 6 

Outras transforma^oes podem ser usadas para converter relates nao lineares 
em lineares. Por exemplo, a transforma<;ao pela raiz cubica (tfy ) e adequada para 
medidas de massa ou volume (Y 3 ), as quais relacionadas alometricamente com 
medidas lineares de tamanho ou comprimento corporal (Y; ver Nota de rodape 
13). Em estudos que examinam as relates entre duas medidas de massa ou vo¬ 
lume (Y 3 ), como a compara^o das massas cerebral e corporal, tanto a variavel 
X quanto Y sao logaritmicamente transformadas. A transforma^ao logaritmica 
reduz a varia<;ao dos dados, que pode variar em varias ordens de magnitude (para 
uma exposi^ao detalhada da rela^ao entre a massa cerebral e a corporal, ver Alli¬ 
son & Cicchetti, 1976; Edwards, 2000). 

Transforma0es de dados por demanda estatistica 

Todos os testes estatisticos requerem que os dados atendam a alguns pressupostos 
matematicos. Por exemplo, os dados a serem analisados usando analise de varian- 
cia (Capitulos 7 e 10) devem satisfazer dois pressupostos: 

1. Os dados devem ser homocedasticos - ou seja, as variancias dos residuos de 
todos os grupos de tratamentos devem ser semelhantes entre si. 

2. Os residuos, ou desvios da media de cada grupo, devem ser variaveis aleato- 
rias normais. 

Da mesma forma, os dados a serem analisados usando regressao ou correla- 
<^ao (Capitulo 9) tambem devem ter residuos com distribui^ao normal e que nao 
sejam correlacionados com a variavel independente. 


1(1 A historia da rela^ao especie-area ilustra os perigos da reifica^ao: a conversao de um conceito abstrato 
em uma coisa material. A fun^ao potencia (S = cA z ) foi a base para varios modelos teoricos importantes 
da rela^ao especie-area (Preston, 1962; MacArthur 8c Wilson, 1967; Harte et al., 1999). Ela tambem tern 
sido usada como argumento para criar reservas naturais maiores, de forma que abriguem o maior nu¬ 
mero possivel de especies. Isso levou a um longo debate sobre se uma unica reserva grande ou se varias 
reservas pequenas poderiam proteger a maioria das especies (p. ex., Willis, 1984; Simberloff 8c Abele, 
1984). No entanto, Lomolino e Weiser (2001) propuseram recentemente que a rela<;ao especie-area tern 
uma assintota, para a qual a fun^ao de potencia nao e apropriada. Mas essa proposta tern sido contes- 
tada com fundamentos teoricos e empiricos (Williamson et al., 2001). Em outras palavras, nao ha um 
consenso de que a fiin^ao de potencia sempre constitui a base para a rela^ao especie-area. 

Essa fun^ao ficou popular porque ela parece fornecer um bom ajuste para muitas relates es- 
pecies-area. No entanto, uma analise estatistica detalhada de 100 relates especies-area publicadas 
(Connor 8c McCoy, 1979) constatou que a fun^ao potencia foi o modelo com melhor ajuste em apenas 
metade dos conjuntos de dados. Embora a area das ilhas geralmente seja um preditor mais forte para 
o numero de especies, na maioria das vezes explica apenas metade da varia^ao da riqueza de especies 
(Boecklen 8c Gotelli, 1984). Como consequencia, o valor da rela^ao especie-area para planejamentos 
de conserva^ao e limitado, porque ha muita incerteza associada as previsoes de riqueza de especies. 
Alem disso, a rela<^ao especie-area pode ser usada apenas para prever o numero de especies presentes, 
enquanto que a maioria das estrategias de manejo para conserva^ao esta interessada na identidade das 
residentes. A moral da historia e que os dados sempre podem ser ajustados a uma fun^ao matematica, 
mas devemos usar ferramentas estatisticas para avaliar se o ajuste e razoavel ou nao. Mesmo se o ajuste 
dos dados for aceitavel, o resultado, por si so, raras vezes e um teste forte para uma hipotese cientifica, 
pois em geral existem modelos matematicos alternativos que bem podem se ajustar aos dados. 
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As transforma<;6es matematicas dos dados podem ser usadas para atender 
esses pressupostos. Em geral, as transforma^oes mais comuns visam a ambos os 
pressupostos de maneira simultanea. Em outras palavras, uma transforma<;ao 
que equaliza as variancias (Pressuposto 1) frequentemente normaliza os residuos 
(Pressuposto 2). 

Cinco transforma0es sao muito usadas com dados ecologicos e ambien- 
tais: a logaritmica, a da raiz quadrada, a angular (ou arcoseno), a reciproca e a de 
Box-Cox. 

A transformaqAo logaritmica A transforma^ao logaritmica (ou transforma- 
<;ao log) substitui o valor de cada observaqao pelo seu logaritmo: 1 * * * * * * * * * * * * * * * 17 


Y* = log(Y) 


(8.9) 


A transformaqao logaritmica (na maioria das vezes usa o logaritmo natural 
ou logaritmo na base e) lh em geral equaliza as variancias de dados em que a 
media e a variancia sao positivamente correlacionadas. Uma correla^ao positiva 



1 Os logaritmos foram inventados pelo escoces John Napier (1550-1617). Em seu 

tomo epico Mirifici logarithmorum canonis descriptio (1614), ele expoe a funda¬ 

mental para a utiliza^ao de logaritmos (a partir da tradu^ao inglesa de 1616): 


Vendo que nao ha nada (certamente aos apaixonados estudantes da ma- 

tematica) que seja mais problematic na pratica da matematica y nem que 

mais nos injuriam e dificultam nossos calculos , do que as multiplica^oes , 

divisoesy extratjoes quadradas e cubicas de numeros grandes, que alem do 

tedioso gasto de tempo estdo em sua maioria sujeitos a muitos erros trai- 

goeiroSy comecei y portantOy a considerar em minha mente qual artimanha 

poderia usar para remover esses entraves. 


John Napier 


Como ilustrado nas Equates 8.4-8.8, o uso de logaritmos permite realizar multiplica^ao e di- 
visao com simples adi^oes e subtra^oes. Series de numeros que sao multiplicativas em uma escala 
linear se tornam aditivas em uma escala logaritmica ( ver Nota de rodape 2, Capitulo 3). 

Is Os logaritmos podem ser calculados em muitas “bases”, e Napier nao especificou uma base em par¬ 
ticular em seu Miriftci. Em geral, para um valor a e uma base by podemos escrever 

log b a = x 

que significa que b x -a. Ja usamos o logaritmo na “base 10” no exemplo da rela^ao especie-area na Tabela 
8.2; para a primeira linha da Tabela 8.2, o log 10 (7498) = 3,875, pois 10 3,87:> = 7498 (arredondando). Uma 
mudan^a em uma unidade log 10 e uma potencia de 10, ou uma ordem de grandeza. Outras bases loga- 
ritmicas usadas na literatura ecologica sao a base 2 (as oitavas de Preston [1962] e usada para dados que 
aumentam em potencias de 2), e a base e, a do logaritmo natural, ou aproximadamente 2,71828... e e um 
numero transcendental, cujo valor foi comprovado por Leonhard Euler (1707-1783) pela igualdade 

lim(l+—)” 

n— ><*> n 

O log t , foi inicialmente tratado como “logaritmo natural” pelo matematico Nicolaus Mercator 
(1620-1687), que nao deve ser confundido com o cartografo Gerardus Mercator (1512-1594). Muitas 
vezes e escrito como In em vez de log t „ 
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significa que grupos com medias grandes tambem terao variancias grandes (na 
ANOVA) ou que a magnitude dos residuos esta correlacionada com a da variavel 
independente (na regressao). Os dados univariados que sao positivamente assi- 
metricos (assimetria a direita) muitas vezes contem alguns dados discrepantes 
grandes. Com uma transforma<;ao de log, esses dados geralmente sao atraidos 
para a parte principal da distribuigao, tornando-se mais simetrica. Os conjun- 
tos de dados que apresentam medias e variancias positivamente correlacionadas 
tambem tendem a ter dados discrepantes com residuos positivamente assime- 
tricos. A transforma^ao logaritmica com frequencia resolve os dois problemas 
ao mesmo tempo. 

Note que o logaritmo de 0 nao e defmido: independentemente da base b, nao 
ha nenhum numero em que a = 0. Uma maneira de contornar esse problema e 
adicionar 1 a cada observa^ao antes de tirar seu logaritmo (como o log(l) = 0, 
independente da base b). No entanto, essa nao e uma solu^ao util ou adequada, 
se o conjunto de dados (ou especialmente se um grupo de tratamento) contem 
muitos zeros. 19 

A TRANSFORMAgAo da RAiz quadrada A transforma<;ao da raiz quadrada subs- 
titui o valor de cada observa^ao pela sua raiz quadrada: 


Y*=4Y (8.10) 

Essa transforma^ao com frequencia e usada com dados de contagem - como 
o numero de lagartas por paineirinha ou o numero de Rhexia por municipio. No 
Capitulo 2, mostramos que esses dados muitas vezes seguem uma distribui<;ao 
de Poisson e salientamos que a media e a variancia de uma variavel aleatoria de 
Poisson sao iguais (ao parametro X da razao de Poisson). Assim, para uma varia¬ 
vel aleatoria de Poisson, a media e a variancia variam de igual forma. Calcular 
a raiz quadrada de variaveis aleatorias de Poisson produz uma variancia que e 
independente da media. Como a raiz quadrada de 0 e igual a 0, a transforma^ao 
da raiz quadrada nao muda dados que sao iguais a 0. Assim, para completar a 
transforma^ao, voce deve somar um numero pequeno aos valores antes de calcu- 


ly Adicionar uma constante antes de calcular logaritmos pode causar problemas para estimar a va- 
riabilidade da popula^ao (McArdle et al., 1990), mas isso nao e uma questao seria para a maioria das 
estatisticas parametricas. No entanto, existem algumas questoes filosoficas sutis em como tratar os 
zeros em um conjunto de dados. Ao adicionar uma constante, voce esta dizendo que 0 representa 
um erro de medi^ao. Presumivelmente, o verdadeiro valor e um numero muito pequeno, mas, por 
chance, voce tinha medido 0 naquela replica. Contudo, se o valor for um zero real, a mais importante 
fonte de varia^ao pode ser entre a ausencia e a presen^a da quantidade medida. Neste caso, seria mais 
apropriado usar uma variavel discreta com duas categorias para descrever o processo. Quanto mais 
zeros no conjunto de dados (e quanto mais forem concentrados em um tratamento), mais provavel 
e que o 0 represente uma condi^ao qualitativamente diferente do que uma medida positiva pequena. 
Em uma serie temporal de uma popula^ao, um zero real representaria uma extin^ao da popula^ao 
em vez de apenas uma medida imprecisa. 
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lar a raiz quadrada. Sokal & Rohlf (1995) sugerem adicionar 1/2 (0,5) a cada valor, 
enquanto Anscombe (1948) sugere 3/8 (0,325). 

A TRANSFORMAgAO DO ARCOSENO OU ARCOSENO DA RAIZ QUADRADA A transforma- 
£ao do arcoseno, arcoseno da raiz quadrada ou transforma^ao angular substitui 
o valor de cada observa^ao pelo arcoseno da raiz quadrada: 


Y* = arcoseno v Y (8.11) 

Essa transforma^ao e utilizada principalmente para proposes (e porcen- 
tagens), que sao distribuidas como variaveis aleatorias binomiais. No Capitulo 
3, observamos que a media de uma distribui^ao binomial = np e sua variancia 
= np{ 1 - p ), onde pea probabilidade de sucesso e n e o numero de tentativas. 
Assim, a variancia e uma fun<;ao direta da media (variancia = (1 - p) vezes a me¬ 
dia). A transforma^ao do arcoseno (que e o inverso da fun^o seno) remove essa 
dependencia. Como a fun^ao seno gera apenas valores entre -1 e +1, o inverso da 
fun<;ao seno pode ser aplicado apenas a dados cujos valores estao entre -1 e +1: -1 
< Y, < +1. Portanto, essa transforma^ao e apropriada apenas para dados que sao 
expressos como proposes (como p, a propor^ao ou a probabilidade de sucesso 
em uma tentativa binomial). Duas advertencias sobre a transformagao arcoseno. 
Primeiro, se seus dados sao porcentagens (escala de 0 a 100), devem ser conver- 
tidos para propor^oes (escala de 0 a 1,0). Segundo, a fun^ao arcoseno gera dados 
transformados com unidades em radianos, nao em graus. 

A TRANSFORMAgAO inversa A transforma^ao inversa substitui o valor de cada 
observa<;ao pelo seu valor inverso: 


Y*=1IY ( 8 . 12 ) 

Normalmente e mais usada para dados que registram taxas, como o nume¬ 
ro de descendentes por femea. Em geral, dados de taxas parecem hiperbolicos 
quando plotados em uma fun^ao da variavel no denominador. Por exemplo, 
se voce plotar o numero de descendentes por femea no eixo Ye o numero de 
femeas na popula«;ao no eixo X , a curva resultante pode parecer uma hiperbole, 
que decresce rapidamente no inicio, e depois conforme o X aumenta. A forma 
desses dados em geral e 

1 

(onde Xeo numero de femeas efeo numero de descendentes por femea), que 
pode ser re-escrita como uma hiperbole 

1 /Y = aX 

Transformar o Y no seu valor inverso, 1/Y, resulta em uma nova rela<;ao 
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Y*= \l{\IY) = aX 

que e mais sujeita a uma regressao linear. 

A TRANSFORMAgAo box-cox Usamos o logaritmo, a raiz quadrada, o valor in- 
verso e outras transforma^oes para reduzir a variancia e a assimetria nos dados 
e criar uma serie de dados transformados que possuam aproximadamente uma 
distribui<;ao normal. A ultima e a transforma^ao de Box-Cox, ou transforma- 
<;ao de potencia generalizada. Essa transforma^ao, na verdade, e uma familia 
expressa pela equa<;ao 


Y* = (Y x -l)/?i (for?i*0) 
Y* = \og e (Y) (fovX = 0) 


onde X e o numero que maximiza a fun^ao log da verossimilhan^a: 

L = -^og e (sj) + {l-l)-^\og e Y (8.14) 

2 n tt 

onde v sao os graus de liberdade, tteo tamanho da amostra, es^ea variancia dos 
valores de Y transformados (Box & Cox, 1964). O valor de X, que resulta quando 
a Equa^o 8.14 e maximizada, e usado na Equa^ao 8.13 para fornecer o melhor 
ajuste dos dados transformados a uma distribui<;ao normal. A Equa<;ao 8.14 deve 
ser resolvida iterativamente (tentando diferentes valores de X ate L ser maximiza- 
do), usando programas de computador. 

Determinados valores de X correspondem as transforma^oes ja descritas. 
Quando X - 1, a Equa^ao 8.13 resulta em uma transforma^ao linear (opera^ao 
de deslocamento; ver Figura 2.7); quando X = 1/2, o resultado e a transforma- 
^ao da raiz quadrada; quando X = 0, o resultado e a transforma«;ao logaritmica 
natural; e quando ^. = -1,0 resultado e a transforma^ao inversa. Antes de par- 
tir para o problema de maximizar a Equa^ao 8.14, voce deve tentar transfor- 
mar seus dados usando transforma^oes aritmeticas simples. Se seus dados tern 
assimetria a direita, tente usar as transforma^des mais familiares a partir da 
serie l/V Y, V Y, ln( Y), 1 /Y. Se tern assimetria a esquerda, tente Y 2 , Y\ etc. (Sokal 
& Rohlf, 1995). 

Apresentando resultados: transformados ou nao? 

Embora voce possa transformar os dados para analise, voce deve relatar os resul¬ 
tados nas unidades originais. Por exemplo, os dados de especie-area da Tabela 8.2 
poderiam ser analisados usando aqueles transformados em log; porem, ao descre- 
ver o tamanho da ilha ou a riqueza de especies, voce deve apresenta-los em suas 
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unidades originais, pela transforma<;ao reversa. Desta forma, o tamanho medio 
das ilhas sera 

antilog(log A) = antilog( 1,654) = 45,110 km 2 

Note que isso e muito diferente da media aritmetica do tamanho das ilhas an¬ 
tes da transforma<;ao, que era igual a 526 km 2 . De forma similar, a riqueza media 
de especies e 

antilog(log S) = 10 1,867 = 73,6 especies 

que difere da media aritmetica da riqueza de especies antes da transforma^ao, 
119,3. 

Voce pode construir intervalos de confian^a ( ver Capitulo 3) de maneira 
similar, tirando o antilog dos limites de confian^a construldos e usando os er- 
ros-padrao das medias dos dados transformados. Isso normalmente resulta em 
intervalos de confian^a assimetricos. Para os dados da area das ilhas na Tabela 
8.2, o erro-padrao da media do log(A) = 0,270. Para n = 17, o valor necessario 
a partir da distribui^ao t, f 0>025|16] = 2,119. Assim, o limite inferior do intervalo 
de confian^a de 95% (usando a Equa^o 3.16) = 1,654 - 2,119 x 0,270 = 1,082. 
De forma similar, o limite superior do intervalo de confian^a de 95% = 1,654 
+ 2,119 x 0,270 = 2,226. Em uma escala logaritmica, esses valores formam um 
intervalo simetrico em torno da media de 1,654, mas quando eles sao retrans- 
formados, o intervalo nao e mais simetrico. O antilog de 1,082 = io 1,082 = 12,08, 
enquanto o antilog de 2,226 = 10 2 ’ 226 = 168.27, que nao e simetrico em torno da 
media retransformada de 45,11. 

0 rastro de auditoria revisitado 

O processo de transforma<;ao dos dados tambem deve ser adicionado ao seu ras¬ 
tro de auditoria. Assim como com os dados da GQ/CQ, os metodos utilizados 
para transforma^ao de dados devem ser documentados nos metadados. Em vez 
de substituir seus dados na planilha original pelos valores transformados, voce 
deve criar uma nova planilha. Essa planilha tambem deve ser armazenada em mi- 
dia permanente, receber um identificador unico em seu catalogo de dados e ser 
adicionada ao rastro de auditoria. 

RESUM0:0 FLUXOGRAMA DE GERENCIAMENTO DE DADOS 

A organiza^ao, a gestao e a curadoria de seu conjunto de dados sao partes essen- 
ciais do processo cientifico e devem ser feitas antes de voce come«;ar a analisar 
seus dados. O processo completo esta resumido em nosso fluxograma de geren- 
ciamento de dados (Figura 8.7). 

Conjuntos de dados bem organizados sao uma contribui«;ao duradoura para 
a comunidade cientifica e seu amplo compartilhamento aumenta a colabora^ao e 
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Dados brutos (cadernos de 
campo, registadores de dados, 
instrumentos, etc) 


Metodos detalhados (cardenos 
de campo, programas de 
coleta de dados, etc) 



Figura 8.7 Fluxograma de gerenciamento de dados. Esse fluxograma descreve os passos para a gestao, a 
curadoria e o armazenamento de dados. Todos estes passos devem ser seguidos antes de a analise formal dos 
dados come^ar. A organiza^ao de metadados e especialmente importante para garantir que o conjunto de da¬ 
dos ainda sera acessivel e utilizavel em urn futuro distante. 
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o ritmo do progresso cientifico. A disponibilidade livre e publica de dados e uma 
exigencia de muitas agendas de financiamento. Dados coletados com recursos 
publicos, distribuidos por agendas e organiza^oes nos Estados Unidos, podem 
ser solicitados a qualquer momento por qualquer pessoa, de acordo com as dis- 
posi^oes da Lei de Liberdade de Informa^ao. Os recursos financeiros adequados 
devem ser or^ados para permitir o gerenciamento de dados. 

Os dados devem ser organizados e informatizados rapidamente apos a coleta, 
documentados com metadados necessarios para reconstruir a coleta dos dados e 
arquivados em midia permanente. Os conjuntos de dados devem ser conferidos 
com cautela em busca de erros de coleta e de transcri^ao, e em busca de dados 
discrepantes que nao sejam dados validos. Qualquer mudan^a ou altera^ao nos 
dados originais (“brutos”) resultante de procedimentos de detec<;ao de erros e da¬ 
dos discrepantes deve ser registrada detalhadamente nos metadados. Os arquivos 
alterados nao devem substituir o de dados brutos. Ao contrario, devem ser arma- 
zenados como novos arquivos de dados (modificados). Um rastro de auditoria 
deve ser usado para procurar versoes posteriores de conjuntos de dados e de seus 
metadados associados. 

A analise de dados grafica exploratoria e o calculo de estatisticas descritivas 
(p. ex., medidas de posi«;ao e de dispersao) devem preceder a analise estatistica 
formal e os testes de hipoteses. Um exame cuidadoso dos graficos e das tabelas 
preliminares pode indicar se os dados precisam ou nao ser transformados antes 
de qualquer analise. As transforma^oes dos dados tambem devem ser documen- 
tadas nos metadados. Uma vez que a versao final do conjunto de dados estiver 
pronta para analise, ela devera ser arquivada em midia permanente, com seus me¬ 
tadados e rastro de auditoria completos. 



< 


> 


Parte III 


anAlise de dados 





< 
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9 

Regressao 


A regressao e utilizada para analisar relates entre variaveis continuas. Em sua 
forma mais basica, a regressao descreve a rela^ao linear entre uma variavel pre- 
ditora, representada graficamente no eixo X, e uma variavel resposta, representada 
no eixo Y. Neste capitulo, explicamos como o metodo de minimos quadrados e usa- 
do para ajustar uma linha de regressao aos dados, e como testar a hipotese acerca dos 
parametros do modelo ajustado. Destacamos as premissas do modelo de regressao, 
descrevemos testes de diagnostico para avaliar o ajuste dos dados ao modelo e expli¬ 
camos como usar os modelos para fazer predi^oes. Fornecemos, tambem, uma breve 
descr^ao de alguns topicos mais avan^ados: regressao logistica, regressao multipla, 
regressao nao linear, regressao robusta, regressao quantifica e analise de caminhos 
(path analysis). Terminamos com uma discussao sobre os problemas da sele^ao de 
modelos: como escolher um subconjunto de variaveis preditoras apropriado e como 
comparar o ajuste relativo de diferentes modelos ao mesmo conjunto de dados. 


DEFININDO UMA LINHA RETA E SEUS DOIS PARAMETROS 

Come^aremos com o desenvolvimento de um modelo linear, pois e o cora^ao da 
analise de regressao. Como descrito no Capitulo 6, um modelo de regressao co- 
me^a com a declara^ao de uma hipotese sobre causa e efeito: o valor da variavel 
X causa, direta ou indiretamente, o valor da variavel Y . 1 Algumas vezes, a dire^ao 


1 Muitos textos de estatistica enfatizam a distin^ao entre correla^ao, duas variaveis sao meramente 
associadas uma com a outra, e regressao, uma rela^ao direta de causa e efeito. Apesar de diferentes 
tipos de estatisticas terem sido desenvolvidas para ambos os casos, achamos que essa distin^ao e 
bastante arbitraria e, muitas vezes, apenas semantica. Afinal, os pesquisadores nao procuram correla¬ 
tes entre variaveis a menos que acreditem ou suspeitem que exista alguma rela<;ao de causa e efeito 
subjacente. Neste capitulo, cobriremos os metodos estatisticos que sao algumas vezes tratados de 
maneira individual nas analises de correla^ao e de regressao. Todas essas tecnicas podem ser usadas 
para estimar e testar associates de duas ou mais variaveis continuas. 
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da causa e efeito e direta - a hipotese de que a area das ilhas controla o numero 
de especies de plantas (Capitulo 8) e nao o inverso. Em outros casos, a dire^ao 
da causa e efeito nao e tao obvia - predadores controlam a abundancia de suas 
presas ou a abundancia de presas dita o numero de predadores. (Capitulo 4) 

Uma vez decidida a dire^ao da causa e efeito, o proximo passo e descrever a 
rela^ao como uma fun^ao matematica: 

Y=f(X) (9.1) 

Em outras palavras, aplicamos a fun^ao/para cada valor da variavel X (a 
entrada) para gerar o valor correspondente da variavel Y (a saida ou o resultado). 
Existem muitas fun^oes interessantes e complexas que podem descrever a rela^ao 
entre duas variaveis, mas a mais simples e de que Y e uma fim^ao linear de X: 

Y=% + ^X (9.2) 

Em palavras, essa fun^ao diz “pegue o valor da variavel X, multiplique por P[ 
e some esse valor a P 0 , o resultado e o valor da variavel 7.” Esta equa<;ao descreve 
o grafico de uma linha reta. O modelo tern dois parametros, P 0 e P P que sao cha- 
mados de intercepto e inclina^ao da reta (Figura 9.1). O intercepto (P 0 ) e o valor 
da fun^ao quando X = 0.0 intercepto e medido nas mesmas unidades da variavel 
Y. A inclina^ao e, portanto, uma taxa e e medida em unidade de AY /AX (leia-se: 
“mudan^a em Y dividida pela mudan 9 a em X”). Se a inclina^ao e o intercepto sao 
conhecidos, a Equa^ao 9.2 pode ser usada para predizer os valores de Y para qual- 



Figura 9.1 Rela^ao linear entre as variaveis XeKA linha e descrita pela equa^ao Y = P 0 + P,X, 
onde P 0 e o intercepto e P, e a inclina^ao da linha. 0 intercepto P 0 e o valor predito da equagao 
quando X = 0. A inclinagao da linha P, e o aumento na variavel Y associado com o de uma unidade 
da variavel X (A Y/ AX). Seo valor deXeconhecido, o valor predito de Y pode ser calculado multipli- 
cando X pela inclina^ao e somando o intercepto (P 0 ). 
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Figura 9.2 Modelos lineares podem aproximarfungoes nao lineares sobre um domfnio limitado 
da variavel X. A interpolate) dentro desses limites pode ser aceitavel e acurada, embora o modelo 
linear (linha verde) nao descreva a verdadeira relagaofuncional entre YeX (curva preta). A extra¬ 
polate se tornara crescentemente menos acurada conforme as previsoes se movem para alem 
da amplitude dos dados coletados. Uma premissa muito importante da regressao linear e que a 
relate entre Xe Y (ou transformanoes dessas variaveis) e linear. 


quer valor de X. Reciprocamente, a Equa^ao 9.2 pode ser usada para determinar o 
valor de X, podendo gerar um valor particular de Y. 

A natureza nao obedece uma equa^ao linear, muitas relates ecologicas sao 
inerentemente nao lineares. Contudo, o modelo linear e o ponto de comedo mais 
simples para ajustar fun<;6es aos dados. Alem disso, mesmo as fun^oes nao linea¬ 
res complexas (onduladas) podem ser aproximadamente lineares sobre uma am¬ 
plitude limitada da variavelX (Figura 9.2). Se, com cuidado, restringirmos nossas 
conclusoes aquela amplitude da variavel X, um modelo linear pode ser uma apro- 
xima^ao valida da fun«;ao. 

AJUSTANDO DADOS A UM MODELO LINEAR 

Primeiro, vamos reformular a Equa^ao 9.2 de forma que ela se adapte aos da¬ 
dos que coletamos. Os dados para uma analise de regressao consistem em uma 
serie de observances pareadas. Cada observanao inclui um valor de X (X,) e 
um valor de Y correspondente (7,), ambos medidos para a mesma replica. O 
subscrito i indica a replica. Se houver um total de n replicas em nossos dados, 
o subscrito i pode assumir qualquer valor inteiro de i = 1 ate n. O modelo que 
iremos ajustar e 


y-Po+M.+s, 


(9.3) 
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Como na Equa^ao 9.2, os dois parametros na equa^ao linear, ( 3 0 e ( 3 ,, sao des- 
conhecidos. Mas agora ha uma terceira quantidade desconhecida, e ; , que repre- 
senta o termo do erro. Enquanto ( 3 0 e ( 3 , sao constantes simples, £ ( e uma variavel 
aleatoria normal. Esta distribui<;ao tern um valor esperado (ou media) de 0, e 
variancia igual a a 2 , que pode ser conhecida ou desconhecida. Se todos os dados 
caem perfeitamente em uma linha reta, entao a 2 e igual a 0, sendo uma tarefa 
facil conectar esses pontos, e entao, medir o intercepto (( 3 0 ) e a inclina«;ao (( 3 ,) 
diretamente a partir da linha. 2 Contudo, a maioria dos dados ecologicos exibe 
mais varia^ao que isso - uma unica variavel raras vezes explicara a maior parte da 
varia^ao dos dados, e os pontos dos dados cairao dentro de uma banda espalhada 
em vez de ao longo de uma linha acentuada. Quanto maior o valor de CT, mais 
ruido, ou erro, havera sobre a linha de regressao. 

No Capitulo 8, ilustramos uma linha de regressao para a rela^ao entre a area 
das ilhas (a variavel X) e o numero de especies de plantas (a variavel Y) nas ilhas 
de Galapagos (Figura 8.6). Cada ponto na Figura 8.6 consistia em uma observa- 
$ao pareada da area da ilha e seu numero de especies de plantas correspondente 
(ver Tabela 8.2). Conforme explicamos no Capitulo 8, usamos uma transforma- 
<^ao logaritmica tanto da variavel X (area) quanto da Y (riqueza de especies) para 
homogeneizar as variancias e linearizar a curva. A seguir, neste capitulo, retorna- 
remos a esses dados sem estarem transformados. 

A Figura 8.6 mostra uma clara rela<;ao entre log 10 (area) e log 10 (numero de 
especies), mas os pontos nao caem perfeitamente sobre uma linha. Onde a linha 
de regressao deve ser colocada? Intuitivamente, parece que deve passar atraves do 
centro da nuvem de dados, defmida pelo ponto (X, F). Para os dados das ilhas, o 
centra corresponde ao ponto (1,654,1,867) (lembre-se de que sao valores trans¬ 
formados). 

Agora, podemos girar a linha atraves daquele ponto central ate chegarmos 
a posi^ao de “melhor ajuste” Mas como definimos o melhor ajuste para a linha? 
Primeiro, vamos definir o residuo quadrado d 2 como a diferen^a quadrada en¬ 
tre o valor do Y t observado e o do Y, que e predito pela equa^ao da regressao 
(Y,). Usamos o acento circunflexo para distinguir entre o valor observado (Y ; ) 
e o valor predito a partir da equa^ao de regressao (Y-). O residuo quadrado df e 
calculado como: 

d^iX-X) 2 (9.4) 


2 E claro, se houver apenas duas observances, uma linha reta sempre ira se ajustar a elas perfeitamente. 
Mas com mais dados nao ha garantia de que uma linha reta seja um modelo significativo. Conforme 
veremos neste capitulo, uma linha reta pode ser ajustada a qualquer conjunto de dados e usada para 
fazer previsoes, independente de quando o modelo ajustado e valido ou nao. Contudo, com um 
grande conjunto de dados, temos ferramentas de diagnostico para avaliar o seu ajuste e podemos 
estabelecer intervalos de confian<;a para as previsoes derivadas do modelo. 
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O desvio e elevado ao quadrado porque estamos interessados na magnitude, 
e nao no sinal, da diferen^a entre os valores observados e preditos (ver nota de 
rodape 8, Capitulo 2). Para qualquer observa^ao Y t em particular, podemos passar 
a linha de regressao por aquele ponto, de forma que seu residuo seja minimizado 
(i d i = 0). Mas a linha de regressao precisa se ajustar a todos os dados coletivamente. 
Portanto, definimos a soma de todos os residuos, tambem chamada de soma dos 
quadrados dos residuos e abreviada como SQR*, como sendo: 

SQR=Y j (Y,-Y,) * 2 (9.5) 

«=i 

A linha de regressao de “melhor ajuste” e a que minimiza a soma dos qua¬ 
drados dos residuos. 3 Ao minimizar a SQR, garantimos que a linha de regressao 
resulte na menor diferen^a media entre cada valor de Y, do valor (Y,) que e predito 
pelo modelo de regressao (Figura 9.3). 4 



Francis Galton (1822-1911) - explorador ingles, antropologo, primo de 
Charles Darwin, outrora estatistico, quintessencial D.W.E.M. (Dead White 
European Male) — e mais lembrado por seu interesse em eugenia e por sua 
afirma^ao de que a inteligencia e herdada e pouco afetada por fatores am- 
bientais. Seus escritos sobre inteligencia, ra$a e hereditariedade o levaram a 
defender restri^oes reprodutivas entre pessoas, fundamentando politicas ra- 
cistas na Australia Colonial. Ele foi elevado a cavaleiro em 1909. 

Em seu artigo de 1866, “Regression towards mediocrity in hereditary struc¬ 
ture,” Galton analisou a altura de filhos adultos e de seus pais com o modelo 
de regressao por minimos quadrados. Apesar de os dados de Galton frequen- 
temente serem usados para ilustrar a regressao linear e a regressao em dire^ao a media, uma reanalise 
recente dos dados originais demonstrou que eles nao sao lineares (Wachsmuth et al., 2003). 

Galton tambem inventou um dispositivo chamado de quincunx (tabua de Galton), uma caixa 
com face de vidro, com fileiras de pinos dentro e um afunilamento no topo. Um chumbo de tamanho 
e massa uniforme e jogado atraves da parte afunilada e defletido pelos pinos em dire^ao a um nume- 
ro modesto de compartimentos. Jogue o suficiente e obtera uma curva normal (gaussiana). Galton 
usou esse dispositivo para obter dados empiricos, mostrando que a curva normal pode ser expressa 
como a mistura de outras curvas normais. 


Francis Galton 


4 Ao longo deste capitulo, apresentaremos formulas, como a Equa^ao 9.5, para a soma dos qua¬ 
drados e outras quantidades usadas em estatistica. Contudo, nao recomendamos que voce use as 
formulas desta forma para fazer seus calculos. Ocorre que essas formulas sao muito suscetiveis a 
erros de arredondamento, que acumulam em uma soma grande (Press et al., 1986). A multiplica- 
<^ao de matrizes e uma forma muito mais confiavel de obter solu^oes estatisticas. De fato, ela e a 
unica maneira de solucionar problemas mais complexos, como a regressao multipla. E importante 
que voce estude essas equates para entender como a estatistica funciona, e e uma boa ideia usar 
um software de planilha eletronica para tentar alguns exemplos “a mao”. Contudo, para analises 
e publica<;6es, voce deve deixar que um pacote dedicado a estatistica fa$a os calculos numericos 
pesados. 


* N. de T. RSS em ingles, para Residual Sum of Squares. 
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Figura 9.3 A soma dos quadrados dos resi'duos e obtida somando os desvios quadrados (d) 
de cada observa^ao da linha de regressao ajustada. A estimativa do parametro dos rmnimos 
quadrados garante que essa linha de regressao minimize a soma dos quadrados dos resi'duos. 
0 + marca o ponto central dos dados ( X, Y). Essa linha de regressao descreve, ainda, a relagao 
entre o logaritmo da area das ilhas e o do numero de especies de plantas das llhas de Galapa¬ 
gos, dados da Tabela 8.2. Aequa^aoda regressao e log, 0 (especies) = 1,320 + log 10 (area)x 0,331 ; 
r 2 = 0,584. 


Poderiamos ajustar a linha de regressao atraves de (X, Y ) “no olho” e, entao, 
mexer com ela ate encontrarmos o valor da inclina^ao e do intercepto que nos de 
o menor valor de SQR. Felizmente, existe uma forma mais simples de obter as es- 
timativas de (3 0 e de (3, que minimizam a SQR. Porem, primeiro precisamos fazer 
um breve desvio para discutir variancias e covariancias. 

variAncias e covariancias 

No Capitulo 3, apresentamos a soma dos quadrados ( SQ Y ) de uma variavel, 

SQy^iY-Y) 2 (9.6) 

i=l 


que mede o desvio quadrado de cada observa^o a partir da media das observa¬ 
nces. Dividindo essa soma por (n - 1), temos a formula familiar para a variancia 
amostral de uma variavel: 
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i= 1 

(9.7) 

Removendo o expoente da Equa^ao 9.6 e expandindo o 
demos re-escrever como: 

termo quadrado, po- 

SQ, = 2 ( ^- ?xy i- ?) 

1=1 

(9.8) 

Agora, consideremos a situa^ao com duas variaveis X e Y. Em vez da soma 
dos quadrados de uma variavel, podemos definir a soma dos produtos cruzados 
( SQ xy ) como: 

1=1 

(9.9) 

e a covariancia amostral ( s XY ) como: 

i=l 

(9.10) 


Como vimos no Capitulo 3, a variancia amostral e sempre um numero nao 
negativo. Porque o quadrado da diferen^a de cada observa^ao a partir da media 
(Y j - Y ) 2 e sempre maior que zero e a soma de todas essas diferen^as quadradas 
tambem deve ser. Mas o mesmo nao e verdade para a covariancia amostral. Su- 
ponha que valores relativamente grandes de X sejam consistentemente pareados 
com valores de Y relativamente pequenos. O primeiro termo na Equa^ao 9.9 ou 
Equa^ao 9.10 sera positivo para os valores X, que sao maiores que X. Mas o se- 
gundo termo (e tambem o produto) sera negativo, pois os valores relativamente 
pequenos de Y, sao menores que Y. De maneira similar, os valores relativamente 
pequenos de X { (aqueles menores que X) serao pareados com os relativamente 
grandes de Y, (aqueles maiores que Y). Se houver muitos pares de dados organiza- 
dos desta forma, a covariancia amostral sera um numero negativo. 

Por outro lado, se os valores grandes de X estiverem sempre associados com 
valores grandes de Y, os termos de somatorio das Equates 9.9 e 9.10 serao positi- 
vos, gerando um termo de covariancia grande e positivo. Por fim, suponha que X 
e Y nao sao relacionados um ao outro, de forma que valores grandes ou pequenos 
de X possam ser, as vezes, associados com valores grandes ou pequenos de Y. Isso 
ira gerar uma cole^ao heterogenea de termos de covariancia, com sinais negativos 
ou positivos. A soma desses termos pode ser proxima de zero. 
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Para os dados das plantas de Galapagos, SQ XY - 6,558, e s XY - 0,410. Todos os 
elementos do termo de covariancia sao positivos, exceto para as contributes 
das ilhas Duncan (- 0,057) e Bindlow (- 0,080). Intuitivamente, pode parecer 
que essa medida de covariancia deveria ser relacionada a inclina^ao da linha de 
regressao, porque ela descreve a rela^ao (positiva ou negativa) entre a variaqio nas 
variaveis X e Y. 5 


ESTIMATIVA DE PARAMETRO P0R Ml'NIMOS QUADRAD0S 


Tendo definido a covariancia, podemos estimar os parametros da regressao que 
minimizam a soma dos quadrados dos residuos: 



(9.11) 


onde a soma dos quadrados de X e: 



Usamos o simbolo f3j para designar nossa estimativa da inclina^ao e para dis- 
tingui-lo de (3,, o verdadeiro valor do parametro. Tenha em mente que (3j tern um 
valor verdadeiro apenas na estrutura da estatistica frequentista. Em uma analise 
bayesiana, os parametros por si so sao vistos como uma amostra aleatoria de uma 
distribui^ao (ver Capitulo 5). Depois, discutiremos a estimativa de parametros 
bayesianos em modelos de regressao. 

A Equa^ao 9.11 ilustra a rela^ao entre a inclina<;ao de um modelo de regres¬ 
sao e a covariancia entre X e Y. Certamente, a inclina^ao e a covariancia de X e Y, 


A covariancia e um unico valor que expressa a rela^ao entre um unico par de variaveis. Suponha que 
tenhamos um conjunto de n variaveis. Para cada par unico (x y , Xj) de variaveis podemos calcular cada 
um dos termos de covariancia s- ; . Existem exatamente n(n - l)/2 pares unicos, que podem ser deter- 
minados usando o coeficiente binomial do Capitulo 2 (ver, tambem, a nota de rodape 4, Capitulo 2). 
Esses termos de covariancia podem, entao, ser arranjados em uma matriz de variancia-covariancia 
quadrada n x n, na qual todas as variaveis sao representadas em cada linha e em cada coluna da 
matriz. A entrada da matriz na linha f, coluna /, e simplesmente s- ; . Os elementos da diagonal dessa 
matriz sao as variancias de cada variavel s n = Sj 2 . Os elementos da matriz acima e abaixo da diagonal 
sao imagens-espelho uma da outra, pois, para cada par de variaveis X i e X jy a Equa^ao 9.10 mostra 
que = s ]t . A matriz de variancia-covariancia e uma pe^a-chave do maquinario usado para obter as 
solu^oes de minimos quadrados para muitos problemas estatisticos (ver tambem , o Capitulo 12 e o 
Apendice). 

A matriz de variancia-covariancia tambem faz uma apari^ao na ecologia de comunidades. Supo¬ 
nha que cada variavel represente a abundancia de uma especie em uma comunidade. Intuitivamente, 
a covariancia na abundancia deveria refletir as formas de intera^oes que ocorrem entre pares de 
especies (negativa para preda^ao e competi^ao, positiva para mutualismo, 0 para intera^oes fracas 
ou neutras). A matriz da comunidade (Levins, 1968) e outras medidas de coeficientes de intera^ao 
par-a-par podem ser computadas a partir da matriz de variancia-covariancia das abundancias e usa- 
das para predizer a dinamica e a estabilidade da assembleia inteira (Laska e Wootton, 1998). 
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na escala da variancia de X. Como o denominador (n - 1) e identico para o cal- 
culo de s XY e de s x , (3 1 tambem pode ser expresso como a razao da soma dos pro- 
dutos cruzados ( SQ XY ) pela soma dos quadrados de X (SQ x ). Para os dados das 
plantas de Galapagos, s XY = 0,410, e s x = 1,240, entao, (3, = 0,410/1,240 = 0,331. 
Lembre-se de que a inclina^ao sempre e expressa em unidades de AY/AX, que, 
neste caso, e a mudan^a em log 10 (numero de especies) dividido pela mudan 9 a em 
log 10 (area da ilha). 

Para encontrar a solu^ao para o intercepto da equa<;ao ((3 0 ), tiramos vantagem 
do fato que a linha de regressao passa atraves do ponto (X, 7). Combinando isso 
a estimativa do (3,, temos: 


p 0 =r-|3|X 


(9.12) 


A 

Para os dados de plantas das ilhas de Galapagos, (3 0 = 1,867 - (0,331)(1,654) 
= 1,319. 

As unidades do intercepto sao as mesmas da variavel Y, que, neste caso, e 
log 10 (numero de especies). O intercepto nos da a estimativa da variavel resposta 
quando o valor da variavel X e igual a zero. Para os nossos dados das ilhas, X = 0 
corresponde a uma area de 1 km 2 (lembre-se de que o log 10 (l,0) = 0,0), com uma 
estimativa de 10 1 ’ 319 = 20,844 especies. 

Ainda ha um ultimo parametro para estimar. Na Equa^ao 9.3, nosso modelo 
de regressao nao incluiu apenas um intercepto (|3 0 ) e uma inclina^ao (p,), mas 
tambem o termo do erro (£,). O termo do erro tern distribui^ao normal com me¬ 
dia 0 e variancia a 2 . Como podemos estimar a 2 ? Primeiro, se a 2 for relativamente 
grande, os dados observados devem ser amplamente dispersos em torno da linha 
de regressao. As vezes, a variavel aleatoria sera positiva, puxando o dado Y- acima 
da linha de regressao. Outros, negativa, puxando o 7; abaixo da linha. Quanto 
menor for o a 2 , mais fortemente os dados irao se agrupar ao redor da linha de 
regressao ajustada. Por fim, se o a 2 = 0, nao devera haver nenhuma dispersao, e os 
dados “cairao sobre a linha” perfeitamente. 

Tal descri^ao parece muito similar a explica<;ao para a soma dos quadrados 
dos residuos ( SQR ), que mede o desvio quadrado de cada observa^ao de seu valor 
ajustado (Equa^ao 9.5). Na estatistica descritiva (Capitulo 3), a variancia amos- 
tral mede o desvio medio de quanto cada observa^ao sai da media (Equa^ao 3.9). 
De maneira similar, nossa estimativa da variancia do erro da regressao e o desvio 
medio de quanto cada observa^ao difere do valor ajustado: 


Iw-y ,) 2 

d 2 = SQR_S_ 


n — 2 n — 2 

n r -.2 


i =1 


£[Yi-(P 0 +Mi) 


n—2 


(9.13) 
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As formulas expandidas sao mostradas para lembra-lo do calculo da SQR 
e do Y- r Como antes, relembre que (3 0 e (3, sao os parametros ajustados da re¬ 
gressao, e^eo valor predito a partir da equa^ao da regressao. A raiz quadrada 
da Equa^ao 9.13, <3, em geral e chamada de erro-padrao da regressao. Note 
que o denominador da variancia estimada e (n - 2), enquanto antes usavamos 
(n - 1) como denominador no calculo da variancia amostral (Equa^ao 3.9). A 
razao para usar (n - 2) e que o denominador sao os graus de liberdade, o nu- 
mero de informa^oes independentes que temos para estimar aquela variancia 
(ver Capitulo 3). Neste caso, ja usamos dois graus de liberdade para estimar o 
intercepto e a inclina^ao da linha de regressao. Para os dados das plantas de 
Galapagos, d = 0,320. 

COMPONENTES DE VARIANCIA E COEFICIENTE DE DETERMINA^AO 

Uma tecnica fundamental das analises parametricas e a parti^ao da soma dos 
quadrados em diferentes componentes, ou fontes. Apresentaremos a ideia aqui e 
retornaremos a ela no Capitulo 10. A partir dos dados brutos, consideraremos a 
soma dos quadrados da variavel Y (SQ y ) para representar a varia^ao total da qual 
tentamos fazer a parti^ao. 

Um componente da varia<;ao total e puro ou erro aleatorio. Essa varia<;ao nao 
pode ser atribuida a nenhuma fonte em particular que nao a amostragem alea- 
toria de uma distribui<;ao normal. Na Equa<;ao 9.3, essa fonte de varia<;ao e £,, e 
ja vimos como estimar essa varia<^ao residual - calculando a soma dos quadrados 
dos residuos (SQR). A varia<;ao remanescente em Y { nao e aleatoria, mas sistema- 
tica. Alguns valores de Y i sao grandes porque estao associados a valores grandes 
de Xj. A fonte dessa varia<;ao e a rela^ao da regressao Y t = (3 0 + P,X,. Por subtra<;ao, 
o componente de varia^ao remanescente que pode ser atribuido ao modelo de 
regressao ( SQ reg ) e: 


SQ reg =SQ y -SQR (9.14) 

Rearranjando a Equa^ao 9.14, a varia^ao total nos dados pode ser aditiva- 
mente dividida nos componentes da regressao ( SQ reg ) e dos residuos (SQR): 

SQ Y =SQ reg + SQR (9.15) 

Para os dados de Galapagos, SQ y = 3,708 e SQR - 1,540. Portanto, SQ reg = 
3,708 - 1,540 = 2,168. 

Podemos imaginar dois extremos neste “corte da torta de variancia”. Suponha 
que todos os dados caiam com perfei^ao sobre a linha de regressao, de forma que 
qualquer valor de Y j possa ser exatamente predito sabendo o valor do X { . Assim, 
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SQR - 0 e SQ y - SQ rcg . Em outras palavras, toda a varia^ao nos dados pode ser 
atribuida a regressao e nao a um componente de erro aleatorio. 

Por outro lado, suponha que a variavel X nao tem nenhum efeito sobre 
a Y. Se nao ha nenhuma influencia de X em Y , entao (^ = 0 e a linha nao tem 
inclina<;ao: 


i^Po + e, 


(9.16) 


Como 8, e uma variavel aleatoria com media 0 e variancia G 2 , tirando vanta- 
gem da operaijao de deslocamento (Capitulo 2), temos: 


N(P 0 ,o) 


(9.17) 


Em palavras, a Equa^ao 9.17 diz que Y e uma variavel aleatoria normal com 
media (ou expectativa) igual a (3 0 e desvio-padrao o. Se nada da varia<;ao em Y 
pode ser atribuido a regressao, a inclina^ao e igual a 0 e os Y i sao tirados de uma 
distribui^ao normal com media igual ao intercepto da regressao (P 0 ) e variancia 
igual a a 2 . Neste caso, SQ Y = SQR, portanto, SQ rcg = 0,0. 

Entre os dois extremos de SQ reg - 0 e SQR - 0 esta a realidade da maioria dos 
conjuntos de dados, que reflete tanto a varia^ao aleatoria quanto a sistematica. 
Um indice natural que descreve a importancia relativa da regressao versus a varia- 
<;ao residual e o familiar r, ou coeficiente de determina^ao: 


r 2 _ SQ r e g 

SQ Y SQ reg + SQR 


(9.18) 


O coeficiente de determina^ao informa a propor^ao de varia^ao na variavel 
Y pode ser atribuida a varia^ao na variavel X atraves de uma simples regressao 
linear. Essa propor^ao varia de 0,0 a 1,0. Quanto maior o valor, menor e a va¬ 
riancia do erro e mais proximos os dados ficam da linha de regressao ajustada. 
Para os dados de Galapagos, r 2 = 0,585, cerca de meio caminho entre nenhuma 
correla<;ao e o ajuste perfeito. Se voce converter o valor do r 2 para uma escala de 
0 a 100, o resultado obtido em geral e tratado como a porcentagem de varia^ao 
em Y explicada pela regressao com o X. Lembre-se, contudo, que a rela<;ao cau¬ 
sal entre as variaveis X e Y e uma hipotese proposta de maneira explicita pelo 
pesquisador (ver Equa<;ao 9.1). O coeficiente de determina^ao - nao importa 
quao grande - nao confirma por si so uma rela^ao de causa e efeito entre as 
duas variaveis. 

Uma estatistica relacionada e o coeficiente de correla^ao momento-produ- 
to, r. Como voce pode imaginar, ore apenas a raiz quadrada do r . Contudo, o 
sinal do r (positivo ou negativo) e determinado pelo da inclina^ao da regressao: 





268 Nicholas J. Gotelli e Aaron M. Ellison 


negativo se o (3, < 0, e positivo se o (3, > 0. Equivalentemente, o r pode ser cal- 
culado como: 


r _ ^Q.\t _ s xr 

V(SQ X )(5Qy) S X S V 


(9.19) 


com o sinal positivo ou negativo saindo do termo de soma dos produtos cruzados 
no numerador/ 1 

TESTES DE HIPOTESES COM REGRESSAO 

Ate agora, aprendemos como ajustar uma linha reta a dados X e Y continuos e 
como usar o criterio de minimos quadrados para estimar a inclina^ao, o inter¬ 
cept© e a variancia da linha de regressao ajustada. O proximo passo e testar hipo- 
teses acerca da linha de regressao ajustada. Relembre que o calculo dos minimos 
quadrados nos da apenas estimativas ((3 0 , (3 p a 2 ) dos valores reais dos parametros 
(|3 0) (3,, a 2 ). Como ha incerteza nessas estimativas, precisamos testar se alguma 
difere significativamente de zero. 

Em particular, o pressuposto subjacente da causa e efeito e incorporado 
no parametro de inclina^ao. Lembre-se de que, ao estipularmos um modelo de 
regressao, assumimos que X causa Y (ver Figura 6.2 para outras possibilidades). 
A magnitude do (3, mede a for^a da resposta do Y as mudan^as em X. Nossa 
hipotese nula e que (3, nao e diferente de zero. Se nao pudermos rejeitar essa 
hipotese, nao ha nenhuma evidencia compelindo uma rela^ao funcional entre 
as variaveis X e Y. Estruturando a hipotese nula e a alternativa nos termos de 
nosso modelo, temos: 


Yf = P 0 + £, (Hipotese nula) 


(9.20) 


Yj - p () + + e ; (Hipotese alternativa) 


(9.21) 


A anatomia de uma tabela ANOVA 

A hipotese nula pode ser testada inicialmente organizando-se os dados em uma 
tabela de analise de variancia (ANOVA). Apesar de a tabela de ANOVA ser natu- 


Rearranjo da Equa<;ao 9.19 revela uma conexao intima entre r e P P a inclina<;ao da regressao: 




Assim, a inclina^ao da linha de regressao acaba por ser o coeficiente de correla^ao w re-escalado” 
em rela^ao ao desvio-padrao do Y e do X. 
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ralmente associada a analise de variancia (ver Capitulo 10), a parti^ao da soma dos 
quadrados e associada a ANOVA, a regressao e a muitos outros modelos lineares 
generalizados (McCullagh e Nelder, 1989). A Tabela 9.1 ilustra uma tabela de ANO¬ 
VA completa, com todos os seus componentes e suas equates. A Tabela 9.2 ilustra 
a mesma tabela de ANOVA com os calculos para os dados das plantas de Galapagos. 
A forma abreviada da Tabela 9.2 e tipica para uma publica«;ao cientifica. 

A tabela de ANOVA tern um numero de colunas que sumariza a parti<;ao da 
soma dos quadrados. A primeira coluna, em geral, e intitulada “Fonte” e indica 
o componente ou a fonte de varia^ao. No modelo de regressao existem apenas 
duas fontes: a regressao e o erro. Adicionamos uma terceira fonte, o total, para 
lembra-lo de que a soma total dos quadrados e igual a dos quadrados da regressao 
e dos erros. Contudo, a linha referente a soma total dos quadrados geralmente e 
omitida das tabelas de ANOVA em publica^oes. Nosso modelo simples de regres¬ 
sao tern apenas duas fontes de varia^ao, mas modelos mais complexos podem ter 
varias fontes de varia<;ao listadas. 

A segunda coluna da os graus de liberdade, em geral abreviados como 
gl*. Como haviamos discutido, os graus de liberdade dependem que quantas 


TABELA 9.1 Tabela de ANOVA completa para uma regressao linear com um unico fa tor 

Graus de Quadrado Quadrado 

liberdade Soma dos medio medio 

Fonte (gl) quadrados (SQ) (QM) esperado Razao-F Valor deP 


Regressao 1 


Residuos n - 2 


Total n -1 


SQreg^iYi-Y) 2 

1=1 


SQ, eg 

1 


SQP = ^(y._y .) 2 

i=i 


SQR 

in-2) 


° 2 +P>I> 

i=1 


SQregj 1 

SQR I (n-2) 


Cauda da distri¬ 
bute) F com 1 
en-2 graus de 
liberdade 


SQy=^(Y-Y) 2 I- 
w (»-l) 


a 


2 

Y 


A primeira coluna da a fonte de varia<^ao nos dados. A segunda coluna da os graus de liberdade (gl) associados a cada 
componente. Para uma regressao linear simples existe apenas 1 grau de liberdade associado a regressao e (n-2) asso¬ 
ciados com o residuo. O grau de liberdade total e (n - 1), pois 1 grau de liberdade sempre e usado para estimar a grande 
media dos dados. O modelo de regressao com um fator divide a varia^ao total em um componente explicado pela regres¬ 
sao e em residuo remanescente (“nao explicado”). A soma dos quadrados e calculada usando os valores de Yobservados 
(Y,), a media dos valores de Y, (Y), e os valores de Y preditos pelo modelo de regressao linear (Yj). Os quadrados medios 
esperados sao usados para construir uma razao-F para testar a hipotese nula de que a varia<;ao associada com o termo da 
inclina<;ao ((3,) e igual a 0,0. O valor do P para esse teste e retirado de uma tabela padrao de valores de F com 1 grau de 
liberdade para o numerador e (n-2) graus de liberdade para o denominador. Os elementos basicos (fonte, gl, soma dos 
quadrados, quadrado medio, quadrado medio esperado, razao-F e o valor de P) sao comuns a todas as tabelas de ANOVA 
em regressoes e em analises de variancia (Capitulo 10). 


* N. de T. Em ingles df, para abreviar degrees of freedom. 
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TABELA 9.2 Forma de publica«;ao da tabela de ANOVA para uma analise de 
regressao dos dados de especie-area das plantas de Galapagos 


Fonte 

gi 

SQ 

QM 

Razao-F 

p 

Regressao 

1 

2,168 

2,168 

21,048 

0,000329 

Residuos 

15 

1,540 

0,103 




Os dados brutos estao na Tabela 8.3, as formulas para esses calculos estao na Tabela 9.1. A soma dos quadra- 
dos totais e os graus de liberdade raras vezes sao incluidos em uma tabela de ANOVA publicada. Em muitas 
publica<;6es, tais resultados poderiam ser reportados mais compactamente como “A regressao linear do log 
da riqueza de especies pelo log da area foi altamente signifkante (modelo Fj 15 = 21,048, p < 0,001). Assim, 
a equa<;ao de melhor ajuste foi log 10 (Riqueza de especies) = 1,867 + 0,331 x log (area das ilhas), r - 0,585.” 
As estatisticas de regressoes publicadas devem incluir o coeficiente de determina<;ao (r 2 ) e as estimativas de 
minimos quadrados da inclina^ao (0,331) e do intercepto (1,867). 


informa<;6es independentes estao disponiveis para estimar a soma dos quadra¬ 
dos em questao. Se o tamanho amostral e n, ha um grau de liberdade associado 
ao modelo de regressao (especificamente a inclina^ao) e (n - 2) graus de liber¬ 
dade associados ao erro. O grau de liberdade total e (1 + n-2) - (n-l).0 total 
e apenas (n- 1) porque 1 grau de liberdade foi usado na estimativa da grande 
media, Y- 

A terceira coluna da a soma dos quadrados (SQ) associada a fonte de varia^ao 
em particular. Na Tabela 9.1 expandida, mostramos as formulas usadas, mas em 
tabelas publicadas (p. ex., Tabela 9.2) somente os valores numericos para a soma 
dos quadrados seriam fornecidos. 

A quarta coluna da o quadrado medio (QM), que e a soma dos quadrados 
dividida por seus graus de liberdade correspondentes. Essa divisao e analoga ao 
calculo de uma simples variancia dividindo SQ Y por (n - 1). 

A quinta coluna refere-se o quadrado medio esperado. Essa coluna nao e 
apresentada em tabelas de ANOVA publicadas, mas e muito preciosa por mostrar 
exatamente o que esta sendo estimado por cada um dos diferentes quadrados rae- 
dios. Tais expectativas sao usadas para formular testes de hipoteses na ANOVA. 

A sexta coluna e a razao-F calculada (e a razao entre dois valores de quadra¬ 
dos medios diferentes). 

A ultima coluna da o valor de probabilidade em cauda correspondente a uma 
razao-F em particular. Especificamente, esta e a probabilidade de obter a razao-F 
observada (ou uma maior) se a hipotese nula for verdadeira. Para o modelo de 
regressao linear simples, a hipotese nula e que (3, = 0, implicando em nenhuma 
rela^ao funcional entre as variaveis X e Y. O valor da probabilidade depende do 
tamanho da razao-F e do numero de graus de liberdade associados ao quadrado 
medio do numerador e ao do denominador. Os valores de probabilidade podem 
ser consultados em tabelas estatisticas, mas eles geralmente sao parte dos resulta¬ 
dos padrao retornados pelos pacotes estatisticos. 






Prindpios de Estati'stica em Ecologia 271 


A fim de compreender como a razao-F e construida, precisamos exami- 
nar os valores dos quadrados medios esperados. O da regressao e a soma da 
variancia do erro da regressao e um termo que mede o efeito da inclina^ao da 
regressao: 


E(QM reg ) = a 2 + 3^ X 2 (9.22) 

1=1 

Em contraste, o valor esperado para o quadrado medio do residuo e simples- 
mente a variancia do erro da regressao: 

E ^ M resiJ = ° 2 (9.23) 

Agora podemos entender a logica por tras da constru^ao da razao-F. A ra- 
zao-F para o teste de regressao usa o quadrado medio da regressao no numera- 
dor e o quadrado medio dos residuos, no denominador. Se a inclina^ao real da 
regressao e zero, o segundo termo na Equa^ao 9.22 (o numerador da razao-F) 
tambem sera zero. Como consequencia, as Equates 9.22 (o numerador da ra- 
zao-F) e 9.23 (o denominador da razao-F) serao iguais. Em outras palavras, se a 
inclina^ao da regressao ((3,) for zero, o valor esperado da razao-F sera 1,0. Para 
uma dada quantidade de variancia do erro: quanto mais acentuada a inclina^ao, 
maior a razao-F. Isto tambem tern sentido intuitivo, porque quanto menor a va¬ 
riancia do erro, mais fortemente os dados estarao agrupados em torno da linha 
de regressao ajustada. 

A interpreta<;ao do valor de P segue o raciodnio desenvolvido no Capi- 
tulo 4. Quanto maior a razao-F (para um dado tamanho amostral e modelo), 
menor o valor de P. Quanto menor o valor de P, mais improvavel sera que a 
razao-F observada seja encontrada caso a hipotese nula seja verdadeira. Com 
valores de P menores que o ponto de corte padrao de 0,05, rejeitamos a hipo¬ 
tese nula e concluimos que o modelo de regressao explica mais varia^ao do 
esperado apenas ao acaso. Para os dados de Galapagos, a razao-F = 21,048. O 
numerador para essa razao-F e 21 vezes maior que o denominador, entao a 
variancia explicada pela regressao e muito maior que a residual. O valor de P 
correspondente = 0,0003. 

Outros testes e intervalos de confian^a 

Como voce pode suspeitar, todos os testes de hipoteses e intervalos de confian^a 
para os modelos de regressao dependem da variancia da regressao (<7 2 ). A par- 
tir disso, podemos calcular outras variancias e testes de significancia (Weisberg, 
1980). Por exemplo, a variancia do intercepto estimado e: 
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( —7 \ 


A 2 A 1 1 X 

a a =° + cn 

Po {» S Q X ) 

(9.24) 


Uma razao-F tambem pode ser construida a partir dessa variancia para testar 
a hipotese nula de que (3 0 = 0,0. 

Note que o intercepto da linha de regressao e subitamente diferente do que e 
calculado quando o modelo tern inclina^ao zero (Equa^ao 9.16): 

n= p„+£, 

Se o modelo tem uma inclina^ao 0, o valor esperado do intercepto e simples- 
mente a media dos valores de Y^: 

E(P„)= Y 

Contudo, para o modelo de regressao com um termo de inclina^ao, o inter¬ 
cepto e o valor esperado quando X, = 0, ou seja, 

B(P 0 ) = fi|(X,.=0) 

Um intervalo de confia^a de 95% do tipo simples pode ser calculado para o 
intercepto como: 

foo- t (a,n-2)°j3 0 - Po — foo + t (a*-2)°p 0 (9.25) 

onde aeo nivel (duas caudas) de probabilidade (a = 0,025 para um interva¬ 
lo de confian^a de 95%), n e o tamanho amostral, t e o valor de uma tabela de 
distribui<;ao-t para o a e n especificados, eo^e calculado como a raiz quadrada 
da Equa^ao 9.24. 

Similarmente, a variancia da estimativa da inclina<;ao e: 


A 2 


'2 a 

“SQx 

(9.26) 


e o intervalo de confian^a correspondente para a inclina^ao e: 

P \~ t(aji-2)®Pi- Pi + ^(a,n-2)^^ l (9.27) 

Para os dados de Galapagos, o intervalo de confian<;a de 95% para o inter¬ 
cepto ((3 0 ) e 1,017 a 1,623, e para a inclina^ao ((3,) e 0,177 a 0,484 (lembre-se de 
que esses sao valores em log 10 ). Como nenhum desses intervalos de confian<;a 
engloba o 0,0, o teste-F correspondente poderia nos fazer recusar a hipotese 
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nula de que (3 0 e (3, sao iguais a 0. Se (3, for igual a 0, a linha de regressao e 
horizontal e a variavel dependente [log 10 (numero de especies)] nao aumen- 
ta sistematicamente com mudan«;as na variavel independente [log 10 (area das 
ilhas)]. Se (3 0 for igual a 0, a variavel dependente assume o valor de 0 quando a 
independente for 0. 

Apesar de a hipotese nula ter sido rejeitada neste caso, os dados observados 
nao caem perfeitamente sobre uma linha reta. Portanto, existe incerteza associada 
a qualquer valor a variavel X em particular. Por exemplo, se voce amostrar repeti- 
damente diferentes ilhas com areas identicas (X), podera haver varia<;ao entre elas 
no numero de especies (transformado em log) registrado.' A variancia dos valores 
ajustados de Y e: 






n 


(X,~X) 2 > 

SQ X 


(9.28) 


e o intervalo de confian^a de 95% e: 

Y— h«.n-2)^(y|X) — ^ ^(a,n-2)^(y|X) (9.29) 

O intervalo de confian^a nao forma uma banda paralela que engloba a linha 
de regressao (Figura 9.4). Pelo contrario, o intervalo se abre quando mais nos 
distanciamos do x, por causa do termo (X ; -X)~ no numerador da Equa<;ao 9.28. 
Esse intervalo de confian<;a que se amplia tern sentido intuitivo. Quanto mais pro- 
ximos estamos do centro da nuvem de pontos, mais confian^a temos na estimati- 
va do Y a partir de amostras com valores repetidos de X. De fato, se escolhermos 
X como o valor ajustado, o desvio-padrao do valor ajustado e equivalente a um 
erro-padrao do valor ajustado medio (ver Capitulo 3): 


7 Infelizmente, existe um desencontro entre a estrutura estatistica de amostragem aleatoria e a natu- 
reza de nossos dados. Afinal de contas, existe apenas um arquipelago de Galapagos, que evoluiu uma 
flora e fauna unica, e nao ha multiplas ilhas de replica identicas em area. Parece duvidoso tratar essas 
ilhas como amostras de um espa^o amostral maior, que por si so nao e claramente defmido - pode- 
riam ser ilhas vulcanicas? Ilhas tropicais do Pacifico? Ilhas oceanicas isoladas? Podemos pensar nos 
dados como uma amostra de Galapagos, exceto que a amostra dificilmente e aleatoria, pois eles con- 
sistem de todas as grandes ilhas principals do arquipelago. Existem poucas ilhas adicionais das qual 
poderiamos coletar dados, mas elas sao consideravelmente menores e com pouquissimas especies 
de plantas e animais. Algumas ilhas sao tao pequenas que sao essencialmente vazias, e esses dados 
de 0 (dos quais nao podemos simplesmente tirar logaritmos) tern efeitos importantes na forma da 
rela^ao (Williams, 1996). A linha de regressao ajustada para todas as ilhas pode nao necessariamente 
ser a mesma para conjuntos de ilhas grandes versus pequenas. Tais problemas nao sao exclusivos de 
dados de relates especie-area. Em qualquer estudo amostral precisamos nos deparar com o fato 
de que o espa^o amostral nao e claramente defmido e que as replicas coletadas podem nao ser nem 
aleatorias nem independentes umas das outras, apesar de usarmos estatisticas que dependem desses 
pressupostos. 







274 Nicholas J. Gotelli e Aaron M. Ellison 



log m (area da ilha) 


Figura 9.4 Linha de regressao (verde escuro), intervalo de confian^a de 95% (linhas verdes) 
e intervalo de predi^ao de 95% (linhas verde claro) para uma regressao log-log do numero de 
especies de plantas de Galapagos contra a area das ilhas (Tabela 8.2). 0 intervalo de confian^a 
descreve a incerteza nos dados coletados, enquanto o intervalo de predi^ao e usado para avaliar 
novos dados ainda nao coletados ou inclui'dos nas analises. Note que o intervalo de confian^a se 
abre conforme nos distanciamos da area media das ilhas com dados coletados. 0 intervalo de 
confian^a se abrindo reflete maior incerteza acerca das precludes para variaveisX, que sao muito 
diferentes daquelas ja coletadas. Note, tambem, que esses intervalos sao descritos em uma escala 
logaritmica. A transformagao reversa (e Y ) e necessaria para converter as unidades em numeros 
de especies. 0 intervalo de confian^a com transforma^ao reversa e muito largo e assimetrico, em 
torno dos valores previstos. 



A variancia e minimizada aqui, pois existem dados observados tanto acima 
quanto abaixo do valor ajustado. Contudo, conforme nos distanciamos de X, exis¬ 
tem menos dados na vizinhan^a, portanto, a predi^ao se torna menos confiavel. 

Uma distin^ao util entre interpola^ao e extrapola^ao pode ser feita agora. 
A interpola^ao e a estimativa de novos valores que estao dentro da amplitude 
dos dados que coletamos; a extrapola^ao significa estimar novos valores alem da 
amplitude dos dados (Figura 9.2). A Equa<;ao 9.29 garante que o intervalo de con- 
fian<;a para valores ajustados sempre sera menor para a interpola<;ao que para a 
extrapola<;ao. 

Por ultimo, suponha que descubramos uma nova ilha no arquipelago, ou 
amostremos uma ilha que nao foi indicada no censo original. Essa nova observa- 
^ao e designada como: 


(X,E) 
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Usaremos a linha de regressao ajustada para construir um intervalo de pre- 
di^ao para o novo valor, que e muito diferente de construir um intervalo de con- 
fian^a para o valor ajustado. O intervalo de confian^a engloba a incerteza acer- 
ca de uma estimativa com base nos dados disponiveis, enquanto o intervalo de 
predi^ao engloba a incerteza acerca de uma estimativa fundamentada em novos 
dados. A variancia da predi<;ao para um unico valor ajustado e: 


<7 2 (ypb = <? 2 


, 1 (X-X) 2> * 

lH-h --- 

SQy 




(9.30) 


E o intervalo de predi^ao correspondente e: 

f (a,«-2)^(y|x) - ^ *(a,n-2)^(y|x) (9.31) 


Esta variancia (Equa«;ao 9.30) e maior que a existente para o valor ajustado 
(Equa^ao 9.28). A Equa^ao 9.30 inclui tanto a variabilidade do erro associado a 
nova observat^ao quanto a da incerteza na estimativa dos parametros da regressao 
dos dados iniciais. 1 ' 

Para fechar essa sessao, notamos que e muito facil (e sedutor) fazer predi<;oes 
pontuais a partir de uma linha de regressao. Contudo, para a maioria dos tipos de 
dados ecologicos, a incerteza associada com a predi^ao em geral e muito grande 
para ser util. Por exemplo, se propusermos uma reserva natural de 10 km 2 com 
base somente na informa^ao contida na rela«;ao especie-area de Galapagos, a pre- 
di^ao pontual a partir da linha de regressao e de 45 especies. Contudo, o intervalo 
de previsao de 95% para essa previsao e de 9 a 229 especies. Se aumentarmos a 
area 10 vezes, para 100 km 2 , a predi^ao pontual seria de 96 especies, podendo va- 
riar de 19 a 485 especies (amplitudes com base em um intervalo de predit^ao com 
transforma<;ao reversa a partir da Equa^ao 9.31). 8 9 Esse intervalo de predi^ao am- 
plo nao e tipico apenas para dados de especie-area, mas tambem para a maioria 
dos dados ecologicos. 


PRESSUP0ST0S DA REGRESSAO 

O modelo de regressao linear que desenvolvemos ate aqui recai sobre quatro pres- 
supostos: 


8 Um refinamento final e que a Equa<;ao 9.31 e apropriada somente para uma predi^ao unica. Se multi- 
plas predi^oes forem feitas, o valor do a precisa ser ajustado para criar um intervalo de predi^oes simul- 
taneas ligeiramente mais amplo. Tambem existem formulas para intervalos de predicao inversa, em que 
uma amplitude de valores de X e obtida para um unico valor da variavel Y (ver Weisberg, 1980). 

9 Para ser exigente, a transfonnai^ao reversa pontual estima a mediana, e nao a media, da distribui<;ao. 
Contudo, intervalos de confian^a com transformacao reversa nao sao tendenciosos, pois os quantis 
(pontos de porcentagem) se traduzem nas escalas transformadas. 
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1. O modelo linear descreve corretamente a rela^ao funcional entre XeY. Este 
e o pressuposto fundamental. Mesmo se a rela^ao geral for nao linear, um 
modelo linear pode continuar apropriado sobre uma amplitude limitada da 
variavel X (Figura 9.2). Se o pressuposto de linearidade for violado, a estima- 
tiva do a 2 sera inflada, porque ele ira incluir tanto um erro aleatorio quanto 
um componente de erro fixo (o ultimo representa a diferen^a entre a fun^ao 
real e a linear que foi ajustada aos dados). E, se a rela«;ao real for nao linear, 
as predi^oes derivadas a partir do modelo serao enganosas, particularmente 
quando extrapoladas para alem da amplitude dos dados. 

2. A variavel X e medida sem erros. Este pressuposto nos permite isolar o 
componente do erro inteiramente como varia<;ao aleatoria associada com a 
variavel resposta (Y). Se houver erros na variavel X, as estimativas da incli- 
na 9 ao e do intercepto serao tendenciosas. Assumindo que nao ha nenhum 
erro na variavel X, podemos usar os estimadores de minimos quadrados, 
que minimizam a distancia vertical entre cada observa^ao e seu valor pre- 
dito (os dj na Figura 9.3). Com erros tanto na variavel X quanto na Y , uma 
estrategia seria minimizar a distancia perpendicular entre cada observa^ao 
e a linha de regressao. Chamada de regressao Modelo II, ela e comumente 
utilizada em componentes principals e outras tecnicas multivariadas ( ver 
Capitulo 12). Contudo, como a solu^ao por minimos quadrados tern se 
provado tao eficiente e e tao usada, esse pressuposto com frequencia e ig- 
norado. 10 

3. Para qualquer dado valor de X, os valores de Y amostrados sao indepen- 
dentes e com erros com distribui^ao normal. O pressuposto de normalidade 
nos permite usar a teoria parametrica para construir intervalos de confian 9 a 
e testes de hipoteses com base na razao-F. Independence, obviamente, e o 
pressuposto critico para todos os dados amostrais ( ver Capitulo 6), mesmo 
sabendo que ela com frequencia e violada a um grau desconhecido em es- 
tudos observacionais. Se voce suspeitar que o valor Y, influencia a proxima 
observa<;ao que coletar ( Y i+l ), uma analise de series temporais pode remover 
os componentes correlacionados da varia^ao do erro. A analise de series tem¬ 
porais foi discutida com brevidade no Capitulo 6. 

4. Variancias sao constantes (homogeneas) ao longo da linha de regressao. 
Este pressuposto nos permite usar uma unica constante a" para a variancia da 
linha de regressao. Se as variancias dependem do X, podemos precisar de uma 
fun«;ao de variancia, ou uma familia inteira de variancias, atribuida a cada va¬ 
lor de X em particular. Variancias nao homogeneas sao um problema comum 
em regressao e podem ser identificadas atraves de graficos de diagnostico ( ver 


" Apesar de pouco mencionada, fazemos um pressuposto similar de ausencia de erro na variavel ca- 
tegorica X na analise de variancia (Capitulo 10). Na ANOVA, temos de assumir que os individuos sao 
corretamente atribuidos aos grupos assinalados (p. ex., nenhum erro na identifica^ao de especies) 
e que todos os individuos dentro de um grupo receberam um tratamento identico (p. ex., todas as 
replicas em um tratamento de u pH baixo” receberam o mesmo nivel de pH). 
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proxima sessao). E de vez em quando e remediada atraves de transforma 9 oes 
das variaveis X e F originais (ver Capitulo 8). Contudo, nao ha nenhuma ga- 
rantia de que uma transforma^ao ira linearizar a rela<;ao e gerar variancias 
homogeneas. Em tais casos, outros metodos (como a regressao nao linear, 
descrita posteriormente neste capitulo) ou modelos lineares generalizados 
(McCullagh & Nelder, 1989) devem ser utilizados. 

Se todos esses pressupostos forem atendidos, o metodo de minimos quadra- 
dos prove estimativas nao tendenciosas de todos os parametros do modelo. Eles 
nao sao tendenciosos, pois amostras repetidas da mesma populate irao produzir 
estimativas de inclina^oes e interceptos que, em media, sao as mesmas dos valores 
de inclina<;ao e intercepto reais subjacentes a populate. 

TESTES DE DIAGNOSTIC*) PARA A REGRESSAO 

Vimos ate agora como obter estimativas por minimos quadrados dos parametros 
de uma regressao linear, como testar hipoteses acerca desses parametros e a cons- 
truir intervalos de confian<;a apropriados. Contudo, uma linha de regressao pode 
ser fo^ada atraves de qualquer conjunto de dados [X, F], independentemente de 
o modelo ser apropriado ou nao. Nesta sessao, apresentaremos algumas ferra- 
mentas de diagnostico para determinar quao bem a linha de regressao estimada 
se ajusta aos dados. Indiretamente, esses diagnostics tambem ajudam a avaliar a 
extensao na qual os dados cumprem os pressupostos do modelo. 

A mais importante ferramenta na analise de diagnostics e o conjunto de 
residuos, {d ( }, que representa as diferen^as entre os valores observados (Fp e os 
valores preditos pelo modelo de regressao (Fp da Equa^ao 9.4. Os residuos sao 
usados para estimar a variancia da regressao, alem de fornecerem importantes 
informa^oes acerca do ajuste do modelo aos dados. 

Representa^ao grafica dos residuos 

Talvez o grafico mais importante para a analise de diagnostico de um modelo 
de regressao e o dos residuos (d) versus os valores ajustados (Fp. Se o modelo 
linear se ajusta bem aos dados, o grafico dos residuos deve exibir uma dis- 
persao de pontos que aproximadamente segue uma distribui^ao normal e sao 
completamente nao correlacionados com os valores ajustados (Figura 9.5A). 
No Capitulo 11, explicaremos o teste de Kolmogorov-Smirnov, que pode ser 
usado para comparar formalmente os residuos a uma distribui^ao normal (ver 
Figura 11.4). 

Dois tipos de problemas podem ser atacados com graficos de residuos. Pri- 
meiro, se os residuos forem correlacionados com os valores ajustados significa 
que a rela^ao nao e linear. O modelo pode estar sistematicamente superesti- 

A 

mando ou subestimando Y { para valores altos da variavel X (Figura 9.5B). Isso 
pode acontecer, por exemplo, quando uma linha reta e for<;ada atraves de dados 
que realmente representam uma rela^ao assintotica, logaritmica ou outra rela- 
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Figura 9.5 Padroes hipoteticos para graficos de diagnostico de residuos (d), versus os valores 
ajustados (Yj) em regressao linear. (A) Distribui^ao esperada dos residuos para um modelo linear 
com distribuiqao normal dos erros. Se os dados sao bem ajustados pelo modelo linear, este e o 
padrao que deve ser encontrado nos residuos. (B) Residuos para um ajuste nao linear. Neste caso, 
o modelo sistematicamente superestima os valores reais do Y conforme o X aumenta. Uma trans- 
forma^ao matematica (p. ex., logaritmo, raiz quadrada ou inverso) pode produzir uma rela^ao mais 
linear. (C) Residuos para uma rela^ao quadratica ou polinomial. Neste caso, os residuos positivos 
grandes ocorrem para valores da variavel X, que sao muito pequenos, e para valores muito grandes. 
Uma transformagao polinomial da variavel X (X 2 ou alguma potencia maior de X) pode produzir 
um ajuste linear. (D) Residuos com heterocedasticidade (variancia aumentando). Neste caso, os re¬ 
siduos nao sao consistentemente negativos nem positivos, indicando que o ajuste do modelo e 
linear. Contudo, o tamanho medio dos residuos aumenta com o X (heterocedasticidade), sugerindo 
que erros de medidas podem ser proporcionais ao tamanho da variavel X. Uma transforma^ao loga- 
ritmica ou da raiz quadrada pode corrigir esse problema. As transforma^oes nao sao uma panaceia 
para as analises de regressao e nem sempre resultam em relates lineares. 


9 §o nao linear. Se os residuos primeiro caem sobre os valores ajustados e depois 
caem abaixo, e entao caem acima de novo, os dados podem indicar uma rela<;ao 
quadratica, em vez de linear (Figura 9.5C). Por fim, se os residuos apresentam 
um funil de pontos crescente ou decrescente quando representados graficamente 
contra os valores ajustados (Figura 9.5D), a variancia e heterocedastica: aumen¬ 
tando ou diminuindo com os valores ajustados. Transforma^oes apropriadas 
dos dados, discutidas no Capitulo 8, podem atacar algum ou todos esses pro- 
blemas. Os graficos dos residuos tambem podem destacar dados discrepantes 













Principios de Estati'stica em Ecologia 279 


200 - 

150- 


o 

D 

“O 


to 


<D 

CC 


100 - 


50- 


0- 

-50 - 

-100 - 


». • 


100 


150 




—i-1-1-1— 

200 250 300 350 

Vfhat 



200 - 


150 - 

o 

D 

:g 

100 - 

\n 

(V 

CC 

50 - 


0 - 


-50 - 


-100 




>. 


100 










150 




—i-1-1-1— 

200 250 300 350 

Vfhat 


Figura 9.6 Grafico dos residuos para a rela^ao especie-area das plantas das ilhas de Galapagos 
(Tabela 8.2). Em um grafico de residuos, o eixo-x e o valor predito a partir da equa^ao da regressao 
(Y) e o eixo-y e o residuo, que e a diferen^a entre os valores observados e ajustados. Em um conjun- 
to de dados correspondente as predigoes do modelo de regressao, o grafico dos residuos deve ser 
uma nuvem de pontos, com distribui^ao normal, centralizada no valor medio de 0 (ver Figura 9.5A). 
(A) Grafico dos residuos para a regressao com dados nao transformados (Figura 8.5). Existem mui- 
tos residuos negativos para valores ajustados pequenos, e a distribui^ao dos residuos nao parece 
normal. (B) Grafico dos residuos para a regressao com os mesmos dados apos a transforma^ao por 
log 10 dos eixos-X e Y (Figuras 8.6 e 9.3). A transforma^ao melhorou consideravelmente a distribui^ao 
dos residuos, que nao mais desviam de maneira sistematica nos valores grandes ou pequenos dos 
valores ajustados. O Capitulo 11 descreve o teste de Kolmogorov-Smirnov, usado para verificar se os 
residuos se desviam de uma distribui^ao normal (ver Figura 11.4). 
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(outliers), pontos que caem muito distantes da predi<;ao da regressao do que a 
maioria dos outros dados." 

Para ver os efeitos das transforma^oes, compare as Figuras 9.6A e 9.6B, as 
quais ilustram graficos dos residuos para os dados de Galapagos antes e apos os 
dados serem transformados em log 10 . Sem a transforma^ao, existem muitos resi¬ 
duos negativos e todos agrupados acerca de valores muito pequenos de (Figura 
9.6A). Apos a transforma^ao, os residuos negativos e positivos sao distribuidos de 
maneira uniforme e nao associados com Y i (Figura 9.6B). 

Outros graficos de diagnostico 

O grafico dos residuos pode ser feito nao apenas contra os valores ajustados, mas 
tambem contra outras variaveis que podem ter sido medidas. A ideia e verificar 
a existencia de qualquer varia^ao escondida nos erros que possa ser atribuida a 
uma fonte sistematica. Por exemplo, poderiamos elaborar o grafico dos residuos 
da Figura 9.6B contra alguma medida de diversidade de habitats em cada ilha. Se 
os residuos forem correlacionados positivamente com a diversidade de habitats, 
entao as ilhas que tiverem mais especies que o esperado, com base na area das 
ilhas, em geral terao maior diversidade de habitats. De fato, esta fonte adicional de 
varia^ao sistematica pode ser incluida em um modelo mais complexo de regres¬ 
sao multipla, onde ajustamos coeficientes para duas ou mais variaveis preditoras. 
A representa^ao grafica dos residuos contra variaveis preditoras geralmente e uma 
tatica exploratoria mais simples e confiavel do que assumir um modelo com efei¬ 
tos e intera<;oes lineares. 

Tambem pode ser informativo colocar os residuos contra a data ou a ordem 
da coleta. Esse grafico pode indicar cond^oes alteradas nas medi^oes durante o 
periodo de coleta, como aumento na temperatura ao longo do dia em um estudo 
do comportamento de insetos, ou um medidor de pH com bateria fraca forne- 
cendo resultados tendenciosos para as medidas que foram realizadas por ultimo. 
Tais graficos tambem nos lembram dos problemas inesperados que podem surgir 
ao nao usar a randomiza^ao na coleta de dados. Se coletarmos todas as medidas 
de comportamento de uma especie de inseto durante a manha, ou medirmos o 
pH primeiro em todas as parcelas-controle, teremos introduzido uma inesperada 
fonte de varia<;ao de confusao em nossos dados. 

Afun^ao deinfluencia 

Os graficos dos residuos fazem um bom trabalho para revelar a nao linearidade, 
a heterocedasticidade e os dados discrepantes. Contudo, os dados com pontos in- 


11 Os residuos padronizados (tambem chamados de residuos normalizados) tambem sao calculados 
por muitos pacotes de estatistica. Os residuos padronizados sao escalonados para levar em conta a 
distancia de cada ponto a partir do centro dos dados. Se nao forem padronizados, dados bem distan¬ 
tes de X parecem ser relativamente bem ajustados pela regressao, enquanto pontos mais proximos do 
centro da nuvem de pontos parecem nao se ajustar bem. Os residuos padronizados tambem podem 
ser usados para testar se observances particulares sao estatisticamente dados discrepantes (outliers) 
significantes. Outras medida de distancia dos residuos incluem a distancia de Cook e os valores de 
alavancagem (leverage). Ver Sokal & Rohlf (1995) para detalhes. 




Prindpios de Estati'stica em Ecologia 281 


fluenciaveis sao potencialmente mais traigoeiros. Esses dados podem nao parecer 
discrepantes, mas eles tern uma influencia irregular na estimativa da indinagao e 
do intercepto. Na pior das situates, dados com pontos influenciaveis que estao 
longe da nuvem tipica de pontos podem “mudar” completamente a linha de re¬ 
gressao e dominar a estimativa da indinagao (Figura 7.3). 

A melhor forma de detectar tais pontos e fazer um grafico de fungao de in¬ 
fluencia. A ideia e simples e e, na verdade, uma forma de jackknife (ver Capitulo 
5, nota de rodape 2 e Capitulo 12). Pegue a primeira de n replicas em seu conjun- 
to de dados e a exclua da analise. Recalcule a indinagao, o intercepto e o valor de 
probabilidade. Agora, recoloque aquele dado de volta e exclua o segundo. Calcule 
novamente as estatisticas da regressao, substitua o dado e continue ao longo da 
lista. Se voce tiver n pontos de dados originais, voce terminara com n analises de 
regressao diferentes, cada uma com base em um total de (n - 1) pontos. Agora, 
pegue as estimativas da indinagao e do intercepto de cada uma das analises e faga 
um unico grafico de pontos (Figura 9.7). Neste mesmo grafico, coloque o ponto 
com os valores obtidos com o conjunto de dados completo. Esse grafico das esti- 
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Figura 9.7 Fungao de influencia para a 
regressao linear especie-area dos dados de 
plantas das ilhas de Galapagos (Tabela 8.2). 
Em um grafico de fungao de influencia, cada 
ponto representa a indinagao (pp e o inter¬ 
cepto (p o ) recalculados apos remover uma 
unica observagao do conjunto de dados. 0 
ponto verde e a indinagao e o intercepto es- 
timados com o conjunto de dados comple¬ 
to. (A) No modelo de regressao com dados 
nao transformados, a informagao da maior 
ilha, Albemarle (ver Figura 8.5), tern uma in¬ 
fluencia muito grande sobre a inclinagao e 
o intercepto, gerando o ponto extremo no 
lado direito inferior do grafico. (B) Fungao 
de influencia calculada para a linha de re¬ 
gressao ajustada aos dados transformados 
em log )0 . Apos a transformagao logaritmica 
(Figuras 8.6 e 9.3), ha, agora, uma nuvem de 
pontos mais homogenea na fungao de in¬ 
fluencia. Embora a indinagao e o intercepto 
mudem com a exdusao de cada observa- 
gao, nenhuma tern uma influencia extrema 
sobre o intercepto e a indinagao calculados. 
Neste conjunto de dados, a transformagao 
logaritmica nao melhora somente o ajuste 
linear dos dados, ela tambem estabiliza a 
estimativa da indinagao e do intercepto, de 
forma que nao sejam dominadas por um ou 
dois pontos influenciaveis. 
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mativas do intercepto versus a da inclina^ao sempre tera uma inclina^ao negativa, 
pois, conforme a linha de regressao sobe, a inclina^ao aumenta e o intercepto 
diminui. Tambem pode ser informativo criar um histograma com os valores do 
r ou as probabilidades de cauda, que sao associadas com cada um daqueles mo- 
delos de regressao. 

A fun^ao de influencia ilustra quanto a estimativa dos parametros da regres¬ 
sao poderia mudar apenas com a exclusao de um unico dado. Idealmente, a es¬ 
timativa dos parametros com jackknife deveria agrupar fortemente ao redor da 
estimativa com o conjunto de dados completo. Um agrupamento de pontos pode 
sugerir que os valores de inclina^ao e intercepto sao estaveis e nao mudariam 
muito com a exclusao (ou adi<;ao) de um unico dado. Por outro lado, se um dos 
pontos esta muito distante do agrupamento, a inclina<;ao e o intercepto sao mui¬ 
to influenciados por aquele unico dado - devemos ser cautelosos a respeito das 
conclusoes acerca dessa analise. Similarmente, quando examinamos o histograma 
de valores de probabilidade, queremos ver todas as observances satisfatoriamente 
agrupadas ao redor do valor de P estimado com o conjunto de dados completo. 
Apesar de esperarmos por alguma varianao, estaremos especialmente com proble- 
mas se uma das amostras de jackknife produzir um valor de P muito diferente de 
todo o resto. Em tal caso, rejeitar ou falhar em rejeitar a hipotese nula depende de 
uma unica observanao, o que e bastante perigoso. 

Para os dados de Galapagos, a fun^ao de influencia destaca a importancia de 
usar uma transformanao apropriada. Para os dados nao transformados, a maior 
ilha do conjunto de dados domina a estimativa do (3,. Se este ponto for excluido, a 
inclinanao aumenta de 0,035 para 0,114 (Figura 9.7A). Em contraste, a fun<;ao de 
influencia para os dados transformados mostra-se muito mais consistente, apesar 
de o (3, ainda variar de 0,286 a 0,390 apos a remo^ao de um unico dado (Figura 
9.7B). Para ambos os conjuntos de dados, os valores de probabilidade sao estaveis 
e nunca estiveram acima de P = 0,023 para qualquer das analises de jackknife. 

Usar o jackknife desta forma nao e exclusividade da regressao. Qualquer ana¬ 
lise estatlstica pode ser repetida com cada dado sistematicamente excluido. Isso 
pode consumir um pouco de tempo, 12 mas e uma excelente forma de avaliar a 
estabilidade e a validade geral de nossas conclusoes. 

MONTE CARLO E ANALISE BAYESIANA 

A estimativa por minimos quadrados e os testes de hipoteses sao representati¬ 
ves da classica analise parametrica frequentista, pois assumem (em parte) que o 
termo do erro no modelo de regressao e uma variavel aleatoria normal, que os 
parametros tern valores fixos e reais a serem estimados e que os valores de P sao 
derivados de distributes de probabilidade fundamentadas em amostras infini- 


12 Na verdade, existem sabias solu^oes com matrizes para obter os valores de jackknife, apesar de nao 
serem implementadas na maioria dos pacotes estatisticos. A fun^ao de influencia e mais importante 
para pequenos conjuntos de dados que podem ser rapidamente analisados usando op^oes de sele^ao 
de casos, disponiveis na maioria dos softwares estatisticos. 
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tas. Como enfatizamos no Capitulo 5, as abordagens de Monte Carlo e bayesianas 
diferem filosoficamente ou em sua implementa^ao (ou ambos), mas tambem po- 
dem ser usadas para analise de regressao. 

Regressao linear usando metodos de Monte Carlo 

Para a abordagem de Monte Carlo, ainda usamos todos os estimadores de mi- 
nimos quadrados para os parametros do modelo. Contudo, em uma analise de 
Monte Carlo, relaxamos o pressuposto de erros com distribui«;ao normal, de for¬ 
ma que os testes de significancia nao sejam mais fundamentados em compara 9 oes 
de razoes-F. Em vez disso, randomizamos, reamostramos os dados e simulamos os 
parametros diretamente para estimar sua distribui<;ao. 

Para uma analise de regressao linear, qual seria o metodo de randomiza^ao 
adequado? Podemos simplesmente aleatorizar os valores Y j observados e pa- 
rea-los com os valores de X t . Para tal conjunto de dados aleatorizado podemos 
calcular a inclina^ao, o intercepto, r 2 , ou qualquer outra estatistica de regressao 
usando os metodos descritos anteriormente. O metodo de randomiza<;ao efeti- 
vamente quebra qualquer covariancia entre as variaveis X e Y, e representa a hi- 
potese nula de que a variavel X (neste caso, a area da ilha) nao tern nenhum efeito 
sobre a variavel Y (neste caso, a riqueza de especies). Intuitivamente, os valores de 
inclina«;ao e do r esperados devem ser aproximadamente zero para os conjuntos 
de dados aleatorizados, embora, por acaso, alguns tenham diferido. Para os dados 
de Galapagos, 5.000 randomiza^oes dos dados geraram um conjunto de valores 
de inclina^ao com media de -0,002 (bem proximo de 0) e amplitude de -0,321 a 
0,337 (Figura 9.8). Contudo, somente um dos valores simulados (0,337) excedeu 
a inclina^ao observada de 0,331. Portanto, a probabilidade em cauda estimada 
e 1/5.000 = 0,0002. Por compara^ao, a analise parametrica forneceu essencial- 
mente o mesmo resultado, com um valor de P igual a 0,0003 para F, 15 = 21,118 
(Tabela 9.2). 

Um resultado interessante da analise de Monte Carlo e que os valores de P 
para o teste do intercepto, da inclina^o e do r 2 sao todos identicos. Naturalmente, 
a estimativa do parametro observada e a distribui<;ao simulada para cada uma 
dessas variaveis sao todas muito diferentes. Mas por que as probabilidades em 
cauda sao as mesmas neste caso? A razao e que P () , (3, e r 2 nao sao algebricamente 
independentes uns dos outros, os valores aleatorizados refletem essa interdepen- 
dencia. Como consequencia, a probabilidade em causa se torna a mesma para 
esses valores ajustados quando comparados a distributes com base nos mesmos 
conjuntos de dados aleatorizados. Isto nao acontece na analise parametrica por- 
que os valores de P nao sao determinados pela randomiza^ao dos dados. 

Regressao linear usando metodos bayesianos 

Nossa analise bayesiana come^a com o pressuposto de que os parametros da 
equa 9 ao de regressao nao possuem valores reais a serem estimados, mas, em vez 
disso, sao variaveis aleatorias (ver Capitulo 5). Portanto, a estimativa dos para¬ 
metros de regressao - intercepto, inclina^ao e termo do erro - sao reportados 
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Figura 9.8 Analise de Monte Carlo dos valores de indinagao para a rela<;ao especie-area com 
transforma^ao log-log dos dados de especies de plantas das ilhas de Galapagos (Tabela 8.2, ver 
Figuras 8.6 e 9.3). Cada observa^ao no histograma representa a indinagao por mi'nimos quadrados 
de um conjunto de dados simulado em que os valores de Xe Y foram aleatoriamente misturados. 0 
histograma ilustra a distribui^ao de 5.000 desses conjuntos de dados. A inclina^ao observada com 
os dados originais e representada por uma seta no histograma. A inclina^ao observada excedeu to- 
dos, exceto um dos 5.000 valores simulados. Portanto, a probabilidade em causa estimada de obter 
um resultado tao extremo como este sob a hipotese nula e P= 1/5.000 = 0,0002. Essa probabilidade 
estimada e consistente com a calculada a partir da razao-F para o teste de regressao padrao desses 
dados (P = 0,0003; ver Tabela 9.2). 


como distribui^ao de probabilidades, nao como valores. Para executar qualquer 
analise bayesiana, incluindo a regressao, e necessario ter uma expectativa ini- 
cial para a forma dessas distributees. Essas expectativas iniciais, chamadas de 
distributao de probabilidades a priori, vem de pesquisas anteriores ou do en- 
tendimento que temos do sistema de estudo. No caso de ausencia de pesquisas 
anteriores, podemos usar distributees de probabilidade de priores nao infor- 
mativas, como descrito no Capitulo 5. Contudo, no caso dos dados de Galapa¬ 
gos, podemos tirar vantagem do historico de estudos sobre a rela^ao entre a area 
das ilhas e a riqueza de especies que antecedem a analise dos dados de Galapagos 
feita por Preston (1962). 

Para tal exemplo, iremos executar a analise de regressao bayesiana usando 
dados que Preston (1962) compilou para outras relates especie-area da litera- 
tura ecologica. Ele sumarizou a informa^ao previa disponivel (em sua Tabela 8), 
e observou que, em outros 6 estudos, a inclina^ao media da rela<;ao especie-area 
(grafico log 10 -log ]0 ) = 0,278 com desvio-padrao de 0,036. Preston (1962) nao di- 
vulgou sua estimativa do intercepto, mas nos a calculamos a partir dos dados que 
ele divulgou: o intercepto medio = 0,854 e o desvio-padrao = 0,091). Por fim, 
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precisamos de uma estimativa da variancia do erro da regressao £, que calculamos 
a partir de dados, por ele fornecidos, como 0,234. 

Com essas informa^oes a priori, usamos o Teorema de Bayes para calcular 
uma nova distribui«;ao (a distribui^ao de probabilidades a posteriori ) de cada 
um desses parametros. As distributees de probabilidade a posteriori levam em 
considera^ao a informa^ao previa mais os dados das ilhas de Galapagos. Os resul- 
tados dessas analises sao: 

|3 0 ~N( 1,863; 0,157) 

P, ~N(0,328; 0,145) 

= 0,420 

Em palavras, o intercepto e uma variavel aleatoria normal com media = 
1,863 e desvio-padrao = 0,157, a inclina<;ao e uma variavel aleatoria normal com 
media = 0,328 e desvio-padrao = 0,145, e a variancia da regressao e uma variavel 
aleatoria normal com media 0 e variancia 0,420. 13 

Como interpretamos esses resultados? A primeira coisa e re-enfatizar que, em 
uma analise bayesiana, os parametros sao considerados como variaveis aleato- 
rias - nao tern valores fixos. Assim, o modelo linear (Equa^o 9.3) precisa ser 
re-expresso como: 


F.~ N(% + ^X it a 2 ) (9.32) 

Em palavras, cada observa<;ao Y, e tirada de uma distribui^ao normal com 
media = P 0 + P^, e variancia = a 2 . Similarmente, tanto o intercepto P 0 quanto a 
inclina^ao P, sao, por si so, variaveis aleatorias normais com medias estimadas P () 
e P,, e variancias estimadas correspondentes Sq e Sj. 

Como essas estimativas se aplicam a nossos dados? Primeiro, a linha de re¬ 
gressao tern uma inclina^ao de 0,328 (o valor esperado para P,) e um intercepto 
de 1,863. A inclina^ao difere somente um pouco da linha de regressao por mini- 
mos quadrados, conforme mostrado na Figura 9.4, que tern inclina<;ao de 0,331. 
O intercepto e substancialmente maior do que no ajuste por minimos quadrados, 
sugerindo que um numero maior de ilhas pequenas contribuiu mais para essa 
regressao que as poucas ilhas grandes. 

Segundo, podemos produzir um intervalo de credibilidade de 95%. A compu- 
ta<;ao e essencialmente a mesma mostrada nas Equa 9 oes 9.25 e 9.27, mas a inter- 
preta«;ao do intervalo de credibilidade bayesiano e que o valor medio poderia cair 
dentro do intervalo de credibilidade 95% das vezes. Isso difere da interpreta^ao do 


' Alternativamente poderiamos conduzir essa analise sem nenhuma informa^ao a priori , como foi 
discutido no Capitulo 4. Esta analise bayesiana mais “objetiva” usa distribui^oes de probabilidade 
de priores nao informativas sobre os parametros da regressao. Os resultados para as analises usando 
priores nao informativas sao ((3 0 ~ N(l,866; 0,084), (3, ~ N(0,329; 0,077) e a 2 = 0,119). A falta de di- 
feren^as substanciais entre esses resultados e aqueles com base na distribui^ao de priores informadas 
ilustra que bons dados superam a opiniao subjetiva. 
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intervalo de confiar^a de 95%, que e de que o intervalo de confian^a ira incluir o 
valor real 95% das vezes (ver Capitulo 3). 

Terceiro, se precisarmos predizer a riqueza de especies para uma dada ilha 
de tamanho X t , o numero de especies predito poderia ser encontrado primeiro 
tirando um valor de (3, de uma distribui^ao normal com media = 0,328 e desvio- 
-padrao = 0,145, e entao multiplicando o valor por X } . Depois, tiramos um valor 
para o intercepto (3 0 de uma distribui<;ao normal com media = 1,863 e desvio- 
-padrao = 0,157. Por fim, adicionamos um “ruido” a essa predi^ao, adicionando 
um termo do erro de uma distribui^ao normal com X = 0 e a 2 = 0,42. 

Por fim, algumas palavras acerca do teste de hipoteses. Nao ha uma forma 
para calcular um valor de P em uma analise bayesiana. Nao ha um valor de P, 
pois nao estamos testando uma hipotese acerca de quao improvaveis nossos da¬ 
dos sao, dadas as hipoteses [como na estimativa frequentista de P(dados|H 0 )] 
ou quao frequentemente podemos esperar obter esses resultados dado apenas 
em razao do acaso (como na analise de Monte Carlo). Em vez disso, estimamos 
valores para os parametros. As analises parametricas e de Monte Carlo tambem 
fazem o mesmo, mas o objetivo primario na maioria das vezes e determinar se a 
estimativa e significativamente diferente de zero. As analises frequentistas tam¬ 
bem podem incorporar informa^oes a priori, porem ainda no contexto de um 
teste de hipoteses binario (sim/nao). Por exemplo, se tivermos informaqao previa 
de que a inclinaqao da rela^ao especie-area e (3j = 0,26, e nossos dados de Galapa¬ 
gos sugiram que seja (3, = 0,033, podemos testar se estes sao “significativamente 
diferentes” dos dados previamente publicados. Se a resposta for “sim”, o que voce 
conclui? E se a resposta for “nao”? Uma analise bayesiana assume que voce esta 
interessado em usar todos os dados que tern para estimar a inclina<;ao e o inter¬ 
cepto da rela^ao especie-area. 

0UTR0STIP0S DE ANALISES DE REGRESSAO 

O modelo basico de regressao que desenvolvemos apenas pincela a superficie 
de tipos de analises que podem ser feitas com variaveis continuas preditoras ou 
respostas. Faremos apenas uma breve descri^ao dos outros tipos de analises de 
regressao. Livros inteiros se dedicam a cada um desses topicos individualmente, 
portanto nao pretendemos fornecer nada alem de uma breve introdu^ao. Nao 
obstante, muitos dos mesmos pressupostos, restri^oes e problemas que descreve- 
mos para a regressao linear simples tambem se aplicam para esses metodos. 

Regressao robusta 

O modelo de regressao linear estima a inclina^ao, o intercepto e a variancia, mini- 
mizando a soma dos quadrados dos residuos ( SQR ) (ver Equa^ao 9.5). Se os erros 
seguirem uma distribui^ao normal, a soma dos quadrados dos residuos fornecera 
uma estimativa sem vies dos parametros do modelo. As estimativas por minimos 
quadrados sao sensiveis a dados discrepantes (outliers), porque elas dao maior 
peso aos residuos maiores. Por exemplo, um residuo de 2 contribui com 2 2 = 4 
para a SQR, mas um residuo de 3 contribui com 3 2 = 9 a SQR. A penalidade adi- 
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cionada a um residuo grande e apropriada, pois esses valores maiores serao relati- 
vamente raros se os erros amostrados sao retirados de uma distribuinao normal. 

Contudo, quando dados discrepantes verdadeiros estiverem presentes - dados 
aberrantes (incluindo os erroneos) que nao foram amostrados a partir da mesma 
distribui^ao podem seriamente inflar a estimativa da variancia. O Capitulo 8 
discutiu varios metodos para identificar e tratar dados discrepantes. Outra es- 
trategia e ajustar o modelo usando uma funnao residual, que nao seja sensivel a 
presen^a de dados discrepantes. As tecnicas de regressao robusta usam diferentes 
fun^oes matematicas para quantificar a varia^ao residual. Por exemplo, em vez de 
elevar cada residuo ao quadrado, poderiamos usar seu valor absoluto: 

n n 

residuo = ^Jy. -Y.| = ^T|d. (9.33) 

i=l i=l 

Como na SQR, este residuo e maior se os desvios individuais (d,) forem gran- 
des. Contudo, os muito grandes nao sao penalizados com mais peso porque seus 
valores nao sao elevados ao quadrado. Esse peso e apropriado se voce acredita que 
os dados foram retirados de uma distribui^ao que tern caudas relativamente pesa- 
das (leptocurticas; ver Capitulo 3) se comparadas a uma distribui^ao normal. Ou- 
tras medidas que dao mais ou menos peso aos grandes desvios podem ser usadas. 

Entretanto, uma vez que abandonamos a SQR, nao podemos mais usar as for¬ 
mulas simples para obter estimativas dos parametros da regressao. Em vez disso, 
tecnicas de computador iterativas sao necessarias para encontrar a combina^ao de 
parametros que minimizam os residuos (ver Nota de rodape 5, Capitulo 4). Para 
ilustrar a regressao robusta, a Figura 9.9 mostra os dados de Galapagos com um 
dado discrepante adicional. Uma linha de regressao padrao para esse novo con- 
junto de dados da uma inclina<;ao de 0,241, 27% mais rasa que a inclina<;ao real 
de 0,331, mostrada na Figura 9.4. Duas diferentes tecnicas de regressao robusta, 
usando minimos quadrados aparados ( least-trimmed squares ) (Davies, 1993) e 
estimadores-M (Huber, 1981), foram aplicadas aos dados mostrados na Figura 
9.9. Como na regressao linear padrao, esses metodos de regressao robusta assu- 
mem que a variavel X e medida sem erro. 

A regressao por minimos quadrados aparados minimiza a soma dos quadra¬ 
dos dos residuos (Equa^ao 9.5) aparando uma porcentagem das observances ex- 
tremas. Para um corte de 10% - removendo o decil superior da soma dos quadra¬ 
dos dos residuos -, a inclinanao predita para a relanao especie-area para os dados 
ilustrados na Figura 9.9 e 0,283, uma melhora de 17% sobre a regressao linear 
basica. O intercepto para a regressao de minimos quadrados aparados e 1.401, 
algo maior que o intercepto real. 

Os estimadores-M minimizam o residuo: 
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Figura 9.9 Tres regressoes para a rela^ao especie-area de especies de plantas das ilhas de Ga¬ 
lapagos (Tabela 8.2; ver Figuras 8.6 e 9.3) com a adi^ao de um dado discrepante artificial (outlier). A 
regressao linear padrao (MQ) e relativamente sensi'vel a dados discrepantes. Enquanto a estimativa 
da indina^ao original foi de 0,331, a nova inclinagao e de apenas 0,233, e foi arrastada para baixo 
pelo dado discrepante. 0 metodo de minimos quadrados aparados (MQA) descarta 10% dos dados 
extremos (5% da parte de cima e 5% da parte de baixo). A indina^ao para a regressao por MQA e 
0,283 - um tanto mais proximo a estimativa original, de 0,331, embora a estimativa do intercepto 
tenha aumentado para 1,432. A estimativa-M recupera a estimativa "correta"da indina^ao (0,331) 
e do intercepto (1,319), embora a estimativa da variancia seja praticamente o dobro daquela da 
regressao linear que nao incluia o dado discrepante. Esses metodos de regressao robusta sao uteis 
para ajustar equates de regressao a dados muito variaveis, induindo dados discrepantes. 

onde X, e Y, sao valores das variaveis preditora e resposta, respectivamente; p = 
-log f, onde/e uma fun^ao de densidade de probabilidade dos residuos, e, que sao 
escalonados por um peso s, [f(e/s)]/s, ebe uma estimativa da inclina^ao (3,. O va¬ 
lor de b que minimiza a Equa^ao 9.34 para um dado valor de s e um estimador-M 
robusto da inclina^ao da linha de regressao (3,. O estimador-M efetivamente pon- 
dera os dados pelos seus residuos, de forma que os com maiores residuos contri- 
buam menos para a estimativa da inclina^ao. 

Naturalmente, e necessario fornecer uma estimativa do s para resolver a equa- 
^ao. Venables & Ripley (2002) sugerem que o s pode ser estimado resolvendo a 
equa^ao: 



(9.35) 
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onde V|/ e a derivada do p usado na Equa<;ao 9.34. Felizmente, todos esses calculos 
podem ser feitos com facilidade em programas como o S-Plus ou o R, que pos- 
suem rotinas disponiveis para regressao robusta (Venables & Ripley, 2002). 

A regressao robusta por estimador-M produz a inclina^ao correta de 0,331, 
mas a variancia em torno dessa estimativa e igual a 0,25 - mais de tres vezes maior 
que a variancia (0,07), sem o dado discrepante. Da mesma forma, o intercepto e 
correto em 1,319, mas sua variancia e quase o dobro (0,71 versus 0,43). Por fim, 
a estimativa geral da variancia do erro da regressao e igual a 0,125, mais de 30% 
superior a da regressao simples feita com os dados originais. 

Uma estrategia de compromisso sensato e usar os metodos comuns de mi- 
nimos quadrados para testar hipoteses sobre a significance da inclina^ao e do 
intercepto. Com a presen^a de dados discrepantes, esses testes serao relativamente 
conservatives, pois os dados irao inflar a estimativa da variancia. Contudo, a re¬ 
gressao robusta poderia ser usada para construir intervalos de predi<;ao. A unica 
advertencia e que os erros sao, na verdade, tirados de uma distribui<;ao normal 
com variancia grande, a regressao robusta ira subestimar a variancia e voce oca- 
sionalmente podera ter uma surpresa caso fa«;a predi<;oes a partir do modelo de 
regressao robusta. 

Regressao quanti'lica 

A regressao linear simples ajusta a linha atraves do centro da nuvem de pontos e 
e apropriada para descrever uma rela^ao direta de causa e efeito entre as varia- 
veis X e Y. No entanto, se a variavel X atua como fator limitante, ela pode impor 
um teto para os valores de Y. Assim, a variavel X pode controlar o valor maximo 
para o Y, mas nao ter nenhum efeito abaixo desse maximo. O resultado poderia 
ser um grafico com forma de triangulo. Por exemplo, a Figura 9.10 retrata a 
rela^ao entre a biomassa anual de nozes do carvalho e um “indice de adequa^ao 
das nozes” medido em 43 parcelas amostrais de 0,2 hectares em Missouri - EUA 
(Schroeder & Vangilder, 1997). Os dados sugerem que a adequa«;ao baixa res- 
tringe a biomassa anual das nozes, porem, com adequa^ao alta, a biomassa das 
nozes em uma parcela pode ser alta ou baixa, dependendo de outros fatores 
limitantes. 

A regressao quantilica minimiza os desvios a partir da linha de regressao, 
mas a fun<;ao de minimiza^ao e assimetrica: desvios positivos e negativos sao pon- 
derados diferentemente: 


n 

residuo = ^ |Y, - Y { 

i=i 


h 


(9.36) 


Como na regressao robusta, a fun^ao minimiza o valor absoluto dos desvios, 
de forma que nao seja sensivel aos dados discrepantes. No entanto, a caracteris- 
tica-chave e o multiplicador h. O valor do h e o quantil a ser estimado. Se o sinal 
do desvio dentro do valor absoluto for positivo, ele sera multiplicado por h. Se o 
desvio for negativo, ele sera multiplicado por (1,0 - h). Essa minimiza^ao assime- 
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trica ajusta uma linha de regressao atraves da regiao superior dos dados para um 
h grande e atraves da regiao inferior para um h pequeno. Se h = 0,5, a linha de 
regressao passa atraves do centro da nuvem de dados e e equivalente a regressao 
robusta, usando a Equa^ao 9.5. 

O resultado e uma familia de linhas de regressao que caracterizam os limites 
superiores e inferiores do conjunto de dados (Figura 9.10). Se a variavel X for o 
unico fator que atinge a Y, essas regressoes quantilicas serao grosseiramente para- 
lelas umas as outras. Contudo, se outras variaveis estao em jogo, a inclina^ao das 
regressoes quantilicas superiores serao bem mais ingremes que a linha de regres¬ 
sao padrao. Esse padrao pode ser uma indicativa de um limite superior ou de um 
fator limitante em a<;ao (Cade & Noon, 2003). 

Alguns cuidados sao necessarios com a regressao quantilica. A primeira e que 
a escolha de qual quantil usar e um tanto arbitraria. Alem disso, quanto mais 
extremo for o quantil, menor o tamanho amostral, limitando o poder do teste. 
Ainda, as regressoes quantilicas serao dominadas por dados discrepantes, mesmo 



Figura 9.10 llustra^ao da regressao quantilica. A variavel X e uma medida de adequa^ao das 
nozes em parcelas de floresta, com base em caracteristicas das florestas de carvalho para n = 43 
parcelas amostrais de 0,2 ha em Missouri (dados de Schroeder & Vangilder, 1997). A variavel Y e 
a biomassa anual das nozes em cada parcela. As linhas solidas correspondem as indina^oes da 
regressao quantilica. A linha pontilhada (= 50-esimo percentil) e a linha da regressao padrao por 
minimos quadrados que passa atraves do centro da nuvem de pontos. A regressao quantilica e 
apropriada quando ha um fator limitante que estabelece um teto para a variavel resposta. (Adapta- 
gao e simplificaqao da Figura 3, de Cade et al., 1999.) 
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sabendo que a Equa^ao 9.36 minimiza seus efeitos relativos a solu^ao por mmi- 
mos quadrados. De fato, a regressao quantilica, por defini^ao, e uma linha que 
passa atraves dos dados extremos, motivo pelo qual voce precisa estar certo de que 
esses valores extremos nao representem apenas erros. 

Por fim, a regressao quantilica pode nao ser necessaria, a menos que a hi¬ 
potese realmente seja sobre a existencia de um teto, ou de um fator limitante. 
Com frequencia, a regressao quantilica e usada com dados que produzem grafi- 
cos “triangulares”. Contudo, esses triangulos podem simplesmente refletir hete- 
rocedasticidade - uma variancia que aumenta com valores altos da variavel X. A 
transforma^ao dos dados e a analise cuidadosa dos residuos podem revelar que a 
regressao linear simples e mais apropriada. Ver Thompson et al. (1996), Garvey et 
al. (1998), Scharf et al. (1998) e Cade et al. (1999) para outros metodos de regres¬ 
sao usando dados ecologicos bivariados. 

Regressao logistica 

A regressao logistica e um caso especial em que a variavel Y e categorica, e nao 
continua. O caso mais simples e de uma variavel Y dicotomica. Por exemplo, con- 
duzimos censos temporais em 42 folhas de uma planta carnivora (Darlingtonia 
californica) escolhidas de maneira aleatoria, uma planta-jarro que captura insetos 
(ver Nota de rodape 11, Capitulo 8). Registramos visitas de vespas a 10 das 42 
folhas (Figura 9.11). Podemos usar a regressao logistica para testar a hipotese na 
qual a probabilidade de visita<;ao e relacionada a altura das folhas. 14 

Voce pode ficar tentado a for^ar uma linha de regressao atraves desses dados, 
mas mesmo se eles fossem ordenados com perfei^ao, a rela<;ao pode nao ser linear. 
Em vez disso, a melhor curva de ajuste tern a forma de S, ou logistica, aumentando 
a partir de um minimo ate uma assintota maxima. Esse tipo de curva pode ser 
descrita por uma fun^ao com dois parametros, J3 0 e |3,: 


gPo+M 
l + e p ° + p '* 


(9.37) 


O parametro |3 0 e um tipo de intercepto, pois ele determina a probabilidade 
de sucesso (Y, = 1), p, quando X = 0, entao p = 0,5. O parametro (3, e similar ao 
de inclina^ao, pois determina quao ingreme e o aumento da curva ate o valor 
maximo de p = 1,0. Juntos, (3 0 e (3, especificam a amplitude da variavel X em que 
a maior parte do aumento ocorre, alem de determinar quao rapidamente o valor 
da probabilidade aumenta de 0,0 a 1,0. 


14 E claro que poderiamos usar os bem mais simples teste-f ou ANOVA (Capitulo 10) para comparar a 
altura da plantas visitadas versus nao visitadas. Contudo, uma ANOVA com esses dados subitamente 
torna a causa-e-efeito o foco da analise: a hipotese e de que a altura das plantas influencia a proba¬ 
bilidade de captura, que e o que esta sendo testado com a regressao logistica. A estrutura da ANOVA 
implica que a variavel categorica visita^ao de alguma forma causa ou e responsavel pela diferen^a na 
variavel resposta continua, altura das folhas. 





292 Nicholas J. Gotelli e Aaron M. Ellison 


1 , 0 -| 


• • • 


— • 



o 


> 


0,0 - 


0,8 - 


0,6 - 


0,2 - 



• ft — r 


VlMMM • • • • • • • • 


0 


20 


40 

Altura da folha (cm) 


60 


80 


Figura 9.11 Rela^ao entre a altura das folhas e a visitaqao de vespas a planta carnivora Dar- 
lingtonia californica. Cada ponto representa uma planta diferente em uma popula^ao das Mon- 
tanhas Siskiyou no sudeste de Oregon (Ellison & Gotteli, dados nao publicados). 0 eixo X repre¬ 
senta a altura das folhas, uma variavel preditora conti'nua. 0 eixo Ye a probabilidade de visita^ao 
de vespas. Apesar de ser uma variavel conti'nua, na verdade os dados sao discretos, pois a planta 
e visitada (1) ou nao (0). A regressao logistica ajusta uma curva em forma de S (= logi'stica) a esses 
dados. A regressao logi'stica e usada aqui porque a variavel resposta e discreta, de forma que a 
rela^ao tern uma assintota superior e uma inferior. 0 modelo e ajustado usando a transforma^ao 
logit (Equa^ao 9.38). Os parametros com melhor ajuste (usando maxima verossimilhan^a por 
ajuste iterativo) sao P 0 = -7,293 e P, = 0,115.0 valor deP para urn teste da hipotese nula de que 
(3, = 0 e 0,002, sugerindo que a probabilidade de visita^ao de vespas aumenta conforme a altura 
das folhas. 

A razao para usar a Equanao 9.37 e que, com um pouco mais de algebra, po- 
demos transforma-la como a seguir: 



(9.38) 


Essa transforma<;ao da variavel Y , chamada de transforma^ao logit, converte 
a curva logistica em forma de S em uma linha reta. Embora essa transforma<;ao de 
fato seja linear para a variavel X, nao podemos aplica-la diretamente aos nossos 
dados. Se eles consistem somente em 0’s e 1 ’s para plantas de diferentes tamanhos, 
a Equa^ao 9.38 nao pode ser resolvida, pois In[p/( 1 —p)] e indefinido para p = 1 
ou p = 0. Porem, mesmo se os dados consistissem de estimativas de p com base em 
multiplas observances de plantas com o mesmo tamanho, ainda nao seria apro- 
priado usar os estimadores de minimos quadrados, pois o termo do erro segue 
uma distribuinao binomial, em vez de uma distribuinao normal. 

Alem disso, usamos a abordagem de maxima verossimilhanna, que fornece 
estimativa dos parametros que tornam os dados mais provaveis (ver Nota de ro- 
dape 13, Capitulo 5). Essa solunao inclui uma estimativa da variancia do erro da 
regressao, que pode ser usada para testar a hipotese nula acerca dos valores dos 
parametros e para construir intervalos de confianna, como na regressao padrao. 
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Para os dados da Darlingtonia, as estimativas de maxima verossimilhan^a dos 
parametros sao ( 3 0 = -7,293 e (3, = 0,115. O teste da hipotese nula de que ( 3 , = 0 
gera um valor de P = 0,002 sugere que a probabilidade de visita^ao das vespas 
aumenta com o tamanho das folhas. 

Regressao nao linear 

Embora o metodo de minimos quadrados descreva relates lineares entre va¬ 
riaveis, ele pode ser adaptado para fun<;oes nao lineares. Por exemplo, a dupla 
transforma^ao logaritmica converte uma fun<;ao de potencia para as variaveis X 
e Y, (Y = aX 1 ’), em uma rela<;ao linear entre log(X) e log(Y), [log(F) = log(n) + b 
x log(X)]. Contudo, nem todas as fun<;6es podem ser transformadas assim. Por 
exemplo, muitas fun^oes nao lineares foram propostas para descrever a resposta 
funcional de predadores - ou seja, a mudan^a na taxa de alimenta^ao dos preda- 
dores em fiin^ao da densidade de presas. Se um predador forrageia aleatoriamen- 
te sobre um recurso de presas que e exaurido com o passar do tempo, a rela<;ao 
entre o numero consumido (N c ) e o inicial (N 0 ) e (Rogers, 1972): 

N e = N 0 {l-e a{T> ' N ‘~ T)) j (9.39) 

Nesta equa^ao existem tres parametros a serem estimados: a, a taxa de ataque; 

o tempo de manuseio por presa; e T, o tempo total de manuseio de todas as 
presas. A variavel Y e N c , o numero consumido, e a variavel X e N 0 , o numero ini¬ 
cial de presas. 

Nao ha uma transforma^ao algebrica que lineariza a Equa^ao 9.39, de modo 
que o metodo de mmimos quadrados nao pode ser usado. Em vez disso, uma 
regressao nao linear e usada para ajustar os parametros do modelo da fun^ao 
sem transforma<;ao. Como na regressao logistica (um tipo particular de regressao 
nao linear), metodos iterativos sao usados para gerar parametros que minimizam 
os desvios de mmimos quadrados e permitir os testes de hipoteses e calculo de 
intervalos de confian^a. 

Mesmo quando uma transforma^ao produz um modelo linear, a analise de 
mmimos quadrados assume que os termos do erro, £,, dos dados transformados 
possuem distribui^ao normal. Porem, se na fun^ao original os termos do erro 
tern distribui^ao normal, a transforma<;ao nao ira preservar a normalidade. Em 
tais casos, a regressao linear tambem sera necessaria. Trexler & Travis (1993) e 
Juliano (2001) fornecem boas introduces a analises ecologicas usando regres- 
soes nao lineares. 

Regressao multipla 

O modelo de regressao linear com uma unica variavel preditora X pode ser facil- 
mente estendido a duas ou mais variaveis preditoras, ou a polinomios de ordens 
maiores de uma unica variavel preditora. Por exemplo, suponha que suspeitamos 
que a riqueza de especies atinge o maximo em ilhas com tamanho intermediario, 
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talvez por causa de gradientes na frequencia ou intensidade de disturbios. Pode- 
riamos ajustar um polinomio de segunda ordem que inclua um termo quadrado 
para area da ilha: 


y-po+P.Xi + M^+e, (9.40) 

Esta equa^ao descreve uma fun^ao com um pico na riqueza de especies em 
um tamanho de ilhas intermediario. 1 ^ A Equa^ao 9.40 e um exemplo de regressao 
multipla, pois agora ha duas variaveis preditoras, X e X 1 , que contribuem para Y. 
Entretanto, ele ainda e considerado um modelo de regressao linear (embora seja 
do tipo multipla), pois os parametros J3 f na Equa<;ao 9.40 sao obtidos por meio de 
equates lineares. Se os dados forem modelados como uma fun^ao linear simples, 
ignoramos o termo polinomial, e o componente de varia^ao sistematica X 2 sera 
incorretamente unido ao termo do erro: 

e; =p 2 Xf+e i (9.41) 

Um exemplo mais familiar de regressao multipla e quando duas ou mais 
variaveis preditoras sao medidas em cada replica. Por exemplo, em um estudo 
da varia^ao na riqueza de especies de formigas (S) em florestas de pantanos da 
Nova Inglaterra (Gotelli & Ellison, 2002a,b), medimos a latitude e a altitude de 
cada sltio amostral e usamos as duas variaveis em uma equa<;ao de regressao 
multipla: 


log 10 (S floresta ) = 4,879 - 0,089 (latitude) - 0,001 (altitude) (9.42) 

Ambos os parametros de inclina^o sao negativos porque a riqueza de es¬ 
pecies declina em maiores altitudes e maiores latitudes. Neste modelo temos os 
chamados parametros parciais da regressao, pois a soma dos quadrados dos re- 
siduos de outras variaveis ja foram estatisticamente consideradas. Por exemplo, o 
parametro para a latitude poderia ser encontrado primeiro fazendo a regressao 
da riqueza de especies pela altitude, e depois dos residuos contra a latitude. In- 
versamente, o parametro para a altitude pode ser obtido fazendo a regressao dos 
residuos, da regressao riqueza-latitude, contra a altitude. 

Como os parametros parciais da regressao fundamentam-se na varia^ao resi¬ 
dual nao explicada pelas outras variaveis, eles frequentemente nao serao equiva- 


15 Esse pico pode ser encontrado atraves da derivada da Equa^ao 9.40 e em seu ajuste para ser igual a 0. 
Assim, a riqueza de especies maxima ocorre emX= Embora esta equa^ao produza uma curva 
nao linear para o grafico de Y versus X , o modelo ainda sera uma soma linear de forma Sp/X,, onde X 
e a variavel preditora medida (que pode ser uma variavel transformada) e os p, sao os parametros da 
regressao ajustados. 




Prindpios de Estati'stica em Ecologia 295 


lentes aos estimados em modelos de regressao simples. Por exemplo, se fizermos a 
regressao da riqueza de especies somente pala latitude, o resultado e: 

log l0 (S floresta) = 5,447 - 0,105 (latitude) (9.43) 

E, se fizermos a regressao da riqueza de especies somente pela altitude, temos: 

log 10 (S floresta) = 1,087 -0,001 (altitude) (9.44) 

Com exce^ao do termo da altitude, todos os parametros diferem entre os mo¬ 
delos de regressao linear simples (Equates 9.43 e 9.44) e dos da regressao multi- 
pla (Equa<;ao 9.42). 

Na regressao linear com uma unica variavel preditora, a fun^ao pode ser co- 
locada no grafico como uma linha em duas dimensoes (Figura 9.12). Com duas 
variaveis preditoras, a equa^ao da regressao multipla pode ser colocada no grafico 
como um piano em um espa^o de coordenadas tridimensionais (Figura 9.13). 
O “piso” do espa<;o representa os dois eixos para as duas variaveis preditoras, e 
a dimensao vertical representa a variavel resposta. Cada replica consiste em tres 
medidas (variaveis Y, X, e X 2 ), de forma que os dados podem ser plotados como 
uma nuvem de pontos no espa^o tridimensional. A solu^ao por minimos quadra- 
dos tra^a um piano atraves da nuvem de pontos. O piano e posicionado de forma 


(A) 



(B) 



Altitude (m) 


Figura 9.12 Densidade de formigas de floresta em fun^ao de (A) latitude e (B) altitude. Cada 
ponto (n = 22) e o numero de especies de formiga registrado em parcelas de floresta com 64 m 2 
na Nova Inglaterra (Vermont, Massachusetts e Connecticut). A linha de regressao por minimos 
quadrados e mostrada para cada variavel. Note a transforma^ao por log 10 do eixo Y. Para a regres¬ 
sao pela latitude, a equa^ao e log 10 (numero de especies de formigas) = 5,447 - 0,105 x (latitude); 
r 2 = 0,334. Para a regressao pela altitude, a equa^ao e log 10 (numero de especies de formigas) = 
1,087 - 0,001 x (altitude), t 2 = 0,353. As inclina^oes negativas indicam que a riqueza de especies 
dedina em maiores latitudes e altitudes. (Detalhes sobre os dados e amostragem em Gotelli & 
Ellison, 2002a,b.) 
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Figura 9.13 Representa^ao tridimensional dos dados de uma regressao multipla. A solu^ao de 
minimos quadrados e um piano que passa atraves da nuvem de dados. Cada ponto (n = 22) e o 
numero de especies de formigas registrado em parcelas de floresta com 64 m 2 no norte da Nova 
Inglaterra (Vermont, Massachusetts e Connecticut). A variavel X representa a latitude (a primeira 
variavel preditora), a Y representa a altitude (a segunda variavel preditora) e a Z, o log 10 do numero 
de especies de formigas registrado (a variavel resposta). Uma equagao de regressao multipla foi 
ajustada a equagao: log 10 (numero de especies de formigas) = 4,879 - 0,0089 x (latitude) - 0,001 x 
(altitude), r 2 = 0,583. Note que o valor do r 2 , que e uma medida do ajuste dos dados ao modelo, e 
maior para o de regressao multipla que para ambos os modelos de regressao simples com base em 
apenas uma das variaveis preditoras (Figura 9.12). A solu^ao para uma regressao linear com uma 
variavel preditora e uma reta, enquanto a solu^ao para uma regressao multipla com duas variaveis 
preditoras e um piano, mostrado nessa representa^ao tridimensional. Os residuos sao calculados 
como a distancia vertical de cada dado ate o piano predito. (Detalhes sobre os dados e a amostra- 
gem em Gotelli & Ellison, 2002a,b.) 


que a soma dos quadrados dos desvios verticals de todos os pontos ate o piano 
seja minimizada. 

As solu^oes por matrizes para a regressao multipla sao descritas no Apendice, 
e seu resultado e similar ao da regressao linear simples: a estimativa dos parame- 
tros por minimos quadrados, r 2 , uma razao-F para testar a significance do mo¬ 
delo geral, as variances do erro, os intervalos de confen^a e os testes de hipoteses 
para cada um dos coeficientes. A analise dos residuos e o teste de dados discrepan- 
tes e pontos influenciaveis podem ser realizados como na regressao linear simples. 
Os metodos bayesianos e de Monte Carlo tambem podem ser usados para mode¬ 
los de regressao multipla. 

No entanto, um novo problema surge ao avaliar modelos de regressao multi¬ 
pla, o que nao aconteceu na regressao linear simples: pode haver correla«;ao entre 
as variaveis preditoras, conhecida como multicolinearidade (ver Graham, 2003). 
Idealmente, as variaveis preditoras sao ortogonais umas as outras, uma vez que 
todos os valores de uma variavel preditora sao encontrados em combina^ao com 
os da segunda. Quando discutimos o delineamento de experimentos com dois 
fatores no Capitulo 7, enfatizamos a importancia de garantir que todas as com- 
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bina^oes de tratamentos possiveis fossem representadas em um delineamento 
totalmente cruzado. 

O mesmo prindpio se aplica a regressao multipla: idealmente, as variaveis 
preditoras nao devem ser correlacionadas umas com as outras. Quando isso acon- 
tece, dificulta a separa^ao das contributes de cada uma para a variavel resposta. 
Matematicamente, as estimativas por minimos quadrados tambem come^am a 
ficar instaveis e dificeis de calcular se ha muita multicolinearidade entre as varia¬ 
veis preditoras. Sempre que possivel, delineie seu estudo para evitar correlates 
entre as variaveis preditoras. Contudo, em um estudo observacional, voce pode 
nao ser capaz de quebrar a covariancia de suas variaveis preditoras, ou seja, tera 
que aceitar certo nivel de multicolinearidade. Uma cuidadosa analise dos residuos 
e diagnostics e uma estrategia para lidar com a covariancia entre as variaveis pre¬ 
ditoras. Outra estrategia e combinar matematicamente um conjunto de variaveis 
preditoras intercorrelacionadas em um numero menor de variaveis ortogonais, 
usando metodos multivariados, como os componentes principais ou a analise dis- 
criminante (verCapitulo 12). 

A multicolinearidade e um problema no estudo das formigas? Realmente nao. 
Ha muito pouca correlate entre altitude e latitude, as duas variaveis preditoras 
para a riqueza de especies de formigas (Figura 9.14). 

Analise de caminhos 

Todos os modelos de regressao que discutimos ate agora (linear, robusta, quantilica, 
nao linear e multipla) come^am com a designate de uma unica variavel resposta e 



Figura 9.14 A falta de colinearidade entre as variaveis preditoras fortalece as analises de regres¬ 
sao multipla. Cada ponto representa a latitude e a altitude em um conjunto de 22 parcelas de flores- 
ta em que a riqueza de especies de formigas foi medida (Figura 9.12). Embora a altitude e a latitude 
possam ser usadas simultaneamente como preditoras em um modelo de regressao multipla (Figura 
9.13), o ajuste do modelo pode ser comprometido se houver fortes correlates entre as variaveis 
preditoras (colinearidade). Neste caso, ha somente uma correla$ao muito fraca entre as variaveis 
preditoras latitude e altitude (r 2 = 0,032; F, 20 = 0,66, P = 0,426). I: sempre uma boa ideia testar as 
correlates entre as variaveis preditoras ao usar a regressao multipla. (Detalhes sobre os dados e 
amostragem em Gotelli & Ellison, 2002a,b.) 
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Figura 9.15 Analise de caminhos para modelos de coloniza^ao passiva e de cadeia alimentar 
dos inquilinos da Sarracenia. Cada balao representa um taxon diferente que pode ser encon- 
trado nas folhas de Sarracenia purpurea. Os "insetos-presa" capturados formam as bases des- 
sa cadeia alimentar complexa, que inclui varios rn'veis troficos. Os dados subjacentes consistem 
das abundancias dos organismos medidos em folhas que possuem diferentes rn'veis de agua em 
cada uma (Gotelli et al., dados nao publicados). Os tratamentos foram aplicados durante uma 
esta^ao (maio a agosto de 2000) com um experimento do tipo pressao (ver Capitulo 6) em 50 
plantas (n = 118 folhas). Os dados de abundancia foram ajustados a modelos diferentes de cami¬ 
nhos, que representam dois modelos diferentes de organiza^ao da comunidade. (A) No modelo 
de coloniza^ao passiva, as abundancias de cada taxon dependem do volume de agua em cada 
folha e da quantidade de presas nas folhas, mas nenhuma intera^ao entre os taxons e evocada. 
(B) No modelo trofico, as abundancias sao totalmente determinadas pelas intera^oes troficas 
entre os inquilinos. 0 numero associado a cada seta e o coeficiente padronizado do caminho. Os 
coeficientes positivos indicam que o aumento na abundancia das presas leva a uma eleva^ao na 
abundancia de predadores. Os coeficientes negativos indicam que o aumento da abundancia 
dos predadores leva ao decrescimo na abundancia de presas. A espessura de cada seta e propor- 
cional ao tamanho do coeficiente. Os coeficientes positivos sao representados por linhas verdes 
e os negativos por linhas pretas. w 


uma ou mais variaveis preditoras que podem explicar a varia^ao na resposta. Mas, 
na realidade, muitos modelos de processos ecologicos nao organizam as variaveis 
em uma unica variavel resposta e multiplas variaveis preditoras. Em vez disso, as va¬ 
riaveis medidas podem agir simultaneamente umas sobre as outras com relates de 
causa e efeito. Em vez de isolar a varia^ao em uma unica variavel, deveriamos tentar 
explicar o padrao geral de covariancia de um conjunto de variaveis continuas. 

Este e o objetivo da analise de caminhos (path analysis). Ela for<;a o usuario 
a especificar um diagrama de caminhos que ilustra as relates hipoteticas entre 
as variaveis, que sao conectadas umas as outras por setas simples ou duplas. 
Aquelas que nao interagem diretamente nao sao conectadas por setas. Um dia¬ 
grama de caminhos deste tipo representa uma hipotese mecanistica de intera- 
^oes em um sistema de variaveis. 16 Ele tambem representa uma hipotese estatis- 
tica acerca da estrutura da matriz de variancia e covariancia dessas variaveis (ver 
Nota de rodape 5, na pagina 246). Os parametros parciais da regressao podem 
ser estimados para cada caminho individual do diagrama, e um resumo de esta- 
tisticas de bondade do ajuste (goodness of fit) pode ser derivado para a avalia«;ao 
geral do modelo. 

Por exemplo, a analise de caminhos pode ser usada para testar diferen¬ 
tes modelos de estrutura das comunidades de especies de invertebrados que 


W 16 A analise de caminhos foi usada primeiramente pelo geneticista de poppa¬ 
s’ ^oes Sewall Wright (1889-1988) como um metodo para analisar os padroes de 

covariancia na heranc^a de caracteres. Ela tern sido usada ha bastante tempo 
WhjW nas ciencias sociais, mas se tornou popular aos ecologos apenas recentemente. 

Ela tern algumas das mesmas potencialidades e fraquezas da analise de regres- 
sao multipla. Ver Kingsolver & Schemske (1991), Mitchell (1992), Petraitis et 
^ al. (1996) e Shipley (1997) para boas discussoes sobre analise de caminhos em 
ir a ecologia e evolu<;ao. 


Sewall Wright 
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(A) Modelo de coloniza^ao passiva 



(B) Modelo de cadeia alimentar 



co-ocorrem em folhas da planta-jarro (Gotelli et al., dados nao publicados). 
Os dados consistem de repetidos censos das comunidades inteiras que vivem 
em folhas dessa planta (n — 118 folhas). As replicas sao folhas individuals em 
que se fez o censo, e as variaveis continuas sao as abundancias de cada especie 
de invertebrados. 

Um modelo para explicar a estrutura da comunidade e o de coloniza^ao pas¬ 
siva (Figura 9.15A), no qual a abundancia de cada especie e amplamente determi- 
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preditoras para explicar com mais parcimonia a varia^ao na variavel resposta? 
Para a analise de caminhos, como decidir qual dos modelos a priori melhor se 
ajusta aos dados? 

Metodos de sele^ao de modelos para regressao multipla 

Para um conjunto de dados que tem uma variavel resposta e n variaveis preditoras 
existem (2" - 1) modelos de regressao possiveis que podem ser criados. Isto varia 
desde os modelos lineares simples, com somente uma variavel preditora, ate o 
modelo completo, saturado, de regressao multipla, que tem n variaveis preditoras 
presentes. 1 ' 

Pode parecer que o melhor modelo seria o com o maior r e que explica mais 
da varia^ao dos dados. Entretanto, voce pode observar que o modelo completo, 
saturado, sempre tem o com maior r 2 . Adicionar variaveis em um modelo de re¬ 
gressao nunca aumenta a SQR — geralmente a diminui —, embora o decrescimo 
possa ser muito pequeno ao adicionar certas variaveis ao modelo. 

Por que nao usar apenas as variaveis nas quais os coeficientes de inclina<;ao 
(P,-) do modelo saturado sao estatisticamente diferentes de zero? O problema, 
neste caso, e que os coeficientes - e sua significance estatistica - dependem de 
quais variaveis sao incluidas no modelo. Nao ha nenhuma garantia de que o 
modelo reduzido contendo apenas os coeficientes de regressao significativos 
sera necessariamente o melhor. De fato, alguns coeficientes no modelo reduzido 
poderao nao ser estatisticamente significativos, em especial se houver multicoli- 
nearidade entre as variaveis. 

As estrategias para sele<;ao de modelo incluem a sele^ao progressiva (forward 
selection ), a elimina^ao regressiva (backward elimination ) e os metodos grada- 
tivos (stepwise methods). Na sele<;ao progressiva adicionamos variaveis, uma de 
cada vez, e paramos apos certo criterio. Na elimina<;ao regressiva de modelos, 
iniciamos com o modelo saturado completo (todas as variaveis incluidas) e pas- 
samos a eliminar uma variavel de cada vez. Os modelos gradativos incluem tanto 
passos de sele^ao progressiva quanto de elimina^ao regressiva, para fazer com- 
para^oes de troca, tirando e colocando variaveis no modelo, e avaliando as mu- 
dan^as no criterio. 

Tipicamente, dois criterios sao usados para decidir quando parar de adicio¬ 
nar (ou remover) variaveis. O primeiro criterio e a mudan«;a na estatistica-F do 
modelo ajustado. A razao-F e uma escolha melhor que o r 2 ou a SQR , pois uma 


1 Na verdade, existem bem mais modelos possiveis que estes. Por exemplo, se tivermos duas variaveis 
preditoras, X { e X 2 , podemos criar uma variavel composta X { X 2 . O modelo de regressao 

r i = Po + P 1 X li + P 2 X 2 i+P 3 X 1 ^2i + e i 

possui coeficientes tanto para os efeitos principais de X, e X 2 como para a intera^ao entre X, e X 2 . Este 
termo e analogo a intera^ao entre variaveis discretas na ANOVA com dois fato res (ver Capitulo 10). 
Como dissemos, os pacotes estatisticos aceitarao qualquer modelo linear que voce desejar construir, 
sendo responsabilidade sua examinar os residuos e considerar as implicates biologicas das diferen¬ 
tes estruturas dos modelos. 
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mudan^a na estatistica-F depende tanto da redu^ao no r quanto do numero de 
parametros que e incluido no modelo. Na sele^ao progressiva, continuamos adi- 
cionando variaveis ate que o aumento na estatistica-F seja menor que um limite 
estabelecido. Na elimina^ao regressiva, eliminamos variaveis ate que haja uma 
grande queda na estatistica-F. O segundo criterio para sele^ao de modelos e a 
tolerancia. As variaveis sao removidas do modelo ou nao sao adicionadas caso 
elas criem muita multicolinearidade entre o conjunto de preditoras. Tipicamente, 
o algoritmo dos programas cria uma regressao multipla na qual a candidata e a 
variavel resposta, e as variaveis que ja estao no modelo sao as preditoras. A quan- 
tidade (1 - r 2 ) neste contexto e a tolerancia. Se a tolerancia for muito baixa, a nova 
variavel mostra muita correla^ao com o conjunto existente de variaveis preditoras 
e, por isso, nao sera incluida na equa^ao. 

Todos os programas de computador contem pontos de corte ja configu- 
rados para os valores de F e de tolerancia, motivo pelo qual podem gerar um 
conjunto razoavel de variaveis preditoras para a regressao multipla. No entan- 
to, existem dois problemas nesta abordagem. O primeiro e que nao ha nenhu- 
ma razao teorica do porque os metodos de sele^ao de variaveis encontrarao o 
melhor subconjunto de variaveis preditoras na regressao multipla. O segundo 
problema e que esses metodos de sele^ao fundamentam-se em um criterio de 
otimiza<;ao, de forma que voce termine com apenas um melhor modelo. Os 
algoritmos nao lhe dao modelos alternatives que podem ter valores de F e es- 
tatisticas da regressao que sejam muito similares. Esses modelos alternatives 
incluem diferentes variaveis, mas sao estatisticamente indistinguiveis do unico 
modelo de melhor ajuste. 

Se o numero de variaveis Candidatas nao for muito grande (< 8), uma boa es- 
trategia e calcular todos os modelos de regressao possfveis e entao avalia-los com 
base na estatistica-F ou em outro criterio de minimos quadrados. Desta forma, 
voce pode no minimo ver se existe um grande conjunto de modelos similares que 
podem ser estatisticamente equivalentes. Voce tambem pode encontrar padroes 
nas variaveis - talvez uma ou duas variaveis sempre apare<;am no conjunto final 
de modelos - que lhe ajudem a escolher o subconjunto final. Voce nao pode con- 
fiar em analises estatisticas automatizadas ou computadorizadas para selecionar 
o conjunto de variaveis correlacionadas e identificar o modelo correto para os 
seus dados. Os metodos de sele^ao de modelos que existem sao razoaveis, mas 
arbitrarios. 

Metodos de sele^ao de modelos na analise de caminhos 

A analise de caminhos for^a o investigador a propor modelos especificos que pos- 
teriormente sao avaliados e comparados. A sele^ao do “melhor” modelo na analise 
de caminhos presume que o “correto” e incluido entre as alternativas em avalia^ao. 
Se nenhum dos modelos de caminhos propostos for correto, voce simplesmente 
escolhera um incorreto que se ajuste relativamente bem, comparado aos outros 
modelos incorretos alternatives. 

Tanto na analise de caminhos quanto na regressao multipla, o problema e 
escolher um modelo com variaveis suficientemente capazes de explicar, de forma 
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correta, a varia^ao nos dados e minimizar a soma dos quadrados dos residuos, 
mas que nao tenha tantas variaveis de forma que voce ajuste equates ao ruido 
aleatorio dos dados. As estatisticas de criterios de informa^ao fazem um balan- 
90 entre a redu^ao na soma dos quadrados e a adi^ao de parametros ao modelo. 
Esses metodos penalizam os modelos com mais parametros, mesmo se esses mo- 
delos inevitavelmente reduzem a soma dos quadrados. Por exemplo, um criterio 
de informa^ao para a regressao multipla e o r ajustado: 



(9.45) 


onde n e o tamanho amostral epeo numero de parametros no modelo (p = 2 
na regressao linear simples, com o parametro da inclina^ao e o do intercepto). 
Como o r 2 , esse numero aumenta quanto mais a variancia residual for explicada. 
Entretanto, o r a dj tambem decresce conforme mais parametros sao adicionados ao 
modelo. Portanto, o modelo com o maior r2 a dj nao sera necessariamente o modelo 
com mais parametros. De fato, se os modelos tern muitos parametros e os dados 
sao mal ajustados, o r l/, pode ate mesmo se tornar negativo. 

Para a analise de caminhos, o criterio de informa^ao de Akaike, ou AIC 
(Akaike information criterion), pode ser calculado assim: 


AIC = -2 log[l(01 dados)]+2 K 


(9.46) 


onde 1(01 y) e a verossimilhan^a do parametro estimado do modelo ( 0 ), de acor- 
do com os dados, e K e o numero de parametros no modelo. Na analise de ca¬ 
minhos, o numero de parametros no modelo nao e simplesmente o de setas no 
diagrama de caminhos. A medida de dispersao de cada variavel tambem precisa 
ser estimada. 

O AIC pode ser visto como uma medida de “ruindade do ajuste”, pois, quanto 
maior o numero, pior os dados se ajustam a estrutura da matriz de variancia e 
covariancia implicita no diagrama de caminhos. Por exemplo, o modelo de colo- 
niza^ao aleatoria dos inquilinos possui 21 parametros e um indice de valida^o 
cruzada (uma medida do AIC) de 0,702, enquanto o modelo de cadeia alimentar 
possui 15 parametros e um indice de valida^ao cruzada de 0,466. 

Sele^ao de modelos bayesianos 

As analises bayesianas podem ser usadas para comparar diferentes hipoteses e mo¬ 
delos (como os de regressao com ou sem o termo de inclina^ao (3,; ver Equates 
9.20 e 9.21). Dois metodos foram desenvolvidos (Kass 8 c Raftery, 1995, Congdon, 
2002). O primeiro, chamado de fatores de Bayes, estima a verossimilhan 9 a refe- 
rente a uma hipotese ou um modelo, relativa a outra hipotese ou modelo. Como 
em uma analise bayesiana completa, temos probabilidades a priori P(H 0 ) e P{ Hj) 
para nossas hipoteses ou modelos. A partir do Teorema de Bayes (ver Capitulo 1 ), 
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as probabilidades a posteriori P(H 0 |dados) e P(H,|dados) sao proporcionais as 
probabilidades a priori x as verossimilhan^as L(dados|H 0 ) e L(dados|Hj), respec- 
tivamente: 


P(H,. |dados) oc L(dados| H,) x P(H ; ) (9.47) 

Definimos a razao de chances a priori ( prior odds ratio), ou a probabilidade 
relativa de uma hipotese versus outra hipotese, como: 

P(H 0 )/P(H,) (9.48) 


Se estas forem as duas unicas alternativas, entao P(H 0 ) + P(H,) = 1 (pelo Pri- 
meiro Axioma da Probabilidade, Capitulo 1). A Equa<;ao 9.48 expressa quao mais 
ou menos provavel uma hipotese e em rela«;ao a outra antes de conduzir um ex- 
perimento. No inicio do estudo, esperamos que as probabilidades a priori de cada 
hipotese ou modelo sejam grosseiramente iguais (caso contrario, por que gastar 
seu tempo obtendo dados?), assim a Equa^ao 9.48 * 1. 

Apos a coleta dos dados, calculamos as probabilidades a posteriori. O fator de 
Bayes e a razao de chances a posteriori: 

P(H 0 |dados) / P(H, |dados) (9.49) 

Se a Equa^ao 9.49 » 1, podemos ter razao para acreditar que a H 0 e favorecida 
em rela^ao a H,; contudo, se a Equa^ao 9.49 « 1, podemos confirmar a H,. Usamos 
as Equates 9.47 e 9.48 para, em conjunto, obter a razao de chances a posteriori: 

P(H 0 |dados) / P(H, jdados) = [L(dados| H 0 ) / L(data| H,)] x [P(H 0 ) /P(Hj)] (9.50) 


A Equa^ao 9.50 diz que a razao de chances a posteriori e igual a de verossimi- 
lhan^as vezes a razao de chances a priori. Como esta e igual a 1 em um experimen- 
to com priores nao informativas [P(H 0 )/ P(H,) = 0,5], a razao de verossimilhan- 
^as (tambem chamada de fator de Bayes) pode ser usada como uma estimativa da 
razao de chances a posteriori . IK 

O segundo metodo bayesiano para comparar modelos e aproximar os fato- 
res de Bayes quando as priores nao sao informativas. Esse metodo, chamado de 
criterio de informa^ao de Bayes (BIC - Bayesian information criterion ) e usado 
para sele^ao de modelos, como escolher entre modelos de regressao. Permita que 
X = razao de verossimilhan<;a L(dados | M 0 ) / L(dados | M,) para dois modelos 


18 Os fatores de Bayes sao mais uteis quando existem priores informativas. Como, agora, a maioria dos 
programas bayesianos usa priores nao informativas, ha muito menos enfase nos fatores de Bayes do 
que quando o uso de priores informativas era a norma. Ver Kass & Raftery (1995) para uma discussao 
adicional sobre os fatores de Bayes. 




Prindpios de Estati'stica em Ecologia 305 


M 0 e M p cada um com diferentes numeros de parametros p, e p 2 (por exemplo, a 
Equa^ao 9.20 tem um parametro, (3 0 , e a Equa^ao 9.21 tern dois parametros, (3 0 e 
P,). Definimos o BIC como sendo: 

BIC = 2log e ^ - (pj -p 2 )log e n (9.51) 


onde n e o tamanho amostral. O melhor modelo e o que tiver o menor valor de 
BIC. 19 

Em resumo, a sele^o de um conjunto reduzido de variaveis e uma atividade 
comum em estudos de regressao multipla, mas os criterios usados sao um tanto 
arbitrarios. Tais analises sofrem quando ha multicolinearidade nos dados e se o 
tamanho amostral e muito pequeno. Em geral, existirao no minirno de 10 a 20 
observances para cada variavel independente que voce esta considerando. Muitos 
estudos de regressao, na realidade, nao possuem replica«;ao adequada para a re¬ 
gressao multipla, e ha o perigo de que, mesmo com metodos gradativos, os mode- 
los resultantes nao sejam nem otimos nem parcimoniosos. 

A regressao e a analise de caminhos com estatistica de AIC ou de BIC estao 
um passo adiante a esse respeito, pois elas for^am o investigador a considerar es- 
truturas de modelos explicitas. Entretanto, esse tipo de estrutura de trabalho nem 
sempre pode estar disponivel, em especial nos estagios iniciais de um estudo. Bur¬ 
nham & Anderson (2002) constituem uma excelente introdu^ao ao topico geral 
de ajuste de modelos e criterios de informa<;ao. 


RESUM0 


A regressao e uma ferramenta estatistica poderosa para avaliar a rela^ao entre 
duas ou mais variaveis continuas. Solu<;oes de parametros por minimos quadra- 
dos sao apropriadas e sem vies se o modelo realmente for linear, se a variavel X 
for medida sem erros, se as observances forem independentes e se os termos do 
erro tiverem distribui^ao normal. A analise de residuos e um passo-chave para 
avaliar a validade das premissas da regressao. Metodos mais avan^ados incluem a 
regressao robusta para tratar dados discrepantes, regressao logistica e nao linear 
para relates funcionais que nao sao lineares, e regressao multipla e analise de 
caminhos para tratar multiplas variaveis preditoras e estruturas complexas de 
modelos a priori. 


14 O uso do BIC e similar ao uso do criterio de informa^ao de Akaike (AIC) na sele^ao de modelos 
parametricos (Burnham & Anderson 2002), mas as propriedades estatisticas do BIC nao sao tao bem 
comportadas como as do AIC. 






< 
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Analise de Variancia 


A analise de variancia, ou ANOVA, e a tecnica de Fisher para parti^ao da 
soma dos quadrados, algo que vimos em nossa discussao sobre regres- 
sao (Capitulo 9). Em geral, a ANOVA se refere a uma classe de delineamentos 
amostrais ou experimentais, na qual a variavel preditora e categorica e a variavel 
resposta e continua. Exemplos desses delineamentos incluem os de um fator, os 
blocos aleatorizados e os de parcelas subdivididas. No Capitulo 7, descrevemos o 
formato fisico desses delineamentos, a razao para utiliza-los e algumas vantagens 
e desvantagens de cada um. Este capitulo se concentra na analise de dados e testes 
de hipoteses que sao associados a cada um desses delineamentos. 

Primeiro, explicamos a mecanica da parti<;ao da soma dos quadrados - uma 
tecnica fundamental da ANOVA. A seguir, tra^amos as premissas da ANOVA. Se 
cumpridas, podemos usar a razao-F de Fisher para estimar valores de P para a 
soma dos quadrados partidas. Para cada um dos delineamentos do Capitulo 7, 
explicamos os modelos subjacentes e as tabelas de ANOVA associadas. Tambem 
descrevemos como plotar os dados de forma que voce possa entender os termos 
de intera<;ao em ANOVAs de dois fatores ( two-way ) e ANCOVAs. Explicamos 
como incorporar fatores aleatorios e fixos nas suas analises e como usar esses 
modelos para fazer a parti<;ao de variancias de um conjunto de dados. Descre¬ 
vemos alguns procedimentos usados apos seu teste de ANOVA basico para com- 
parar medias (contrastes a priori e compara<;6es a posteriori ) e concluimos com 
uma discussao sobre como interpretar um conjunto de valores P coletados em 
experiments multiplos. 

E facil perder o foco dos objetivos da ANOVA: a compara^ao de medias entre 
grupos que foram amostrados aleatoriamente. O Capitulo 5 detalha um exemplo 
no qual um pesquisador deseja comparar a densidade de formigueiros em habi¬ 
tats de floresta e campo. Neste sentido, a ANOVA e simplesmente uma extensao 
do conhecido teste- 1, que e usado para comparar as medias de dois grupos amos- 
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trados. Se voce ainda nao o tiver feito, leia os Capitulos 7 e 9 antes deste. Embora 
o Capitulo 9 discuta regressao, ele tambem apresenta a ideia de modelo linear, 
efeitos de tratamentos, parti^ao da soma de quadrados e do arranjo de uma tabela 
de ANOVA. De fato, tanto a regressao quanto a ANOVA sao casos especiais de um 
modelo linear generalizado (McCullagh & Nelder, 1989). Embora os programas 
estatisticos solucionem todas as equates apresentadas neste capitulo, e impor- 
tante que voce entenda este conteudo, pois as configurates-padrao usadas por 
muitos programas nao irao gerar as analises corretas para muitos delineamentos 
experimentais comuns. 

SIMBOLOS E ROTULOS EM ANOVA 

Uma grande dor de cabe^a ao interpretar tabelas de ANOVA e entender os simbo- 
los e rotulos convencionais. Existem muitas variaveis para analisarmos e nao ha 
um conjunto de nota^oes consistentes na literatura. 

Utilizamos um sistema relativamente simples. Primeiro, o simbolo Y e sempre 
reservado para a variavel resposta medida, da mesma forma que vem sendo usado 
ao longo do livro. O simbolo Y indica a media geral dos dados. Qualquer media 
que seja calculada para um subgrupo particular e indicada com um subscrito, 
como Yj. Uma variavel subscrita que nao possua uma barra acima indica um dado 
em particular, como Y i; . A variavel p indica o valor esperado de uma variavel em 
um modelo, e o termo residual do erro e indicado por e, geralmente com algum 
subscrito para indicar os componentes de tratamentos diferentes. 

Letras maiusculas A, B, C... designam os diferentes fatores de um modelo. Os 
niveis diferentes das variaveis sao indicados por subscritos i, j, k... Por exemplo, 
poderiamos escrever A ; para indicar o nivel i do Fator A, e B i para indicar o nivel 
j do Fator B. O numero maximo de niveis para um fator e indicado pela letra 
minuscula correspondente. Entao, se A, indica o nivel i do tratamento para o Fa¬ 
tor A, o numero de niveis do Fator A varia de i = 1 ate a. A exce^ao a esse padrao 
eon minusculo, que representa o numero de replicas utilizadas para estimar a 
soma dos quadrados dentro de grupos (a soma dos quadrados dos residuos), o 
nivel mais baixo em que as replicas sao realizadas. Sempre utilizaremos o simbolo 
padrao da variancia a 2 , independente de quando o componente da variancia e 
para um fator fixo ou para um aleatorio. Mostramos com clareza, no texto ou na 
legenda de tabela, quando cada fator no modelo e fixo ou aleatorio. 

ANOVA E PARTPO DA SOMA DOS QUADRADOS 

A analise de variancia e construida no conceito de parti^ao da soma dos quadra¬ 
dos, que foi introduzido no Capitulo 9. Rapidamente, a varia<;ao total em um con- 
junto de dados pode ser expressa como uma soma de quadrados: a diferen^a entre 
cada observa^ao (F ; ) e a media geral dos dados (Y) e elevada ao quadrado e soma- 
da. Essa varia^ao total pode ser repartida ou dividida em diferentes componentes. 
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Alguns componentes representam varianao aleatoria ou varianao de erro que nao 
e atribuivel a nenhuma causa especifica; ela pode resultar do erro de observanao 
ou outras formas nao especificas (ver Notas de rodape 10 e 11, Capitulo 1). Outros 
componentes representam os efeitos dos tratamentos experimentais aplicados as 
replicas, ou as diferen^as entre categorias amostrais. Uma analise estatistica en- 
volve especificar um modelo subjacente de como as observances podem ser afe- 
tadas por diferentes tratamentos, fazer a parti^ao da soma dos quadrados entre 
os diferentes componentes do modelo e utilizar, entao, os resultados para testar 
hipoteses estatisticas sobre for^a dos efeitos em particular. 

Ilustramos a parti^ao da soma dos quadrados com um delineamento de ANO- 
VA de um fator ( one-way ) utilizado para testar os efeitos do derretimento precoce 
da neve sobre o crescimento de plantas alpinas (p. ex., Price & Waser, 1998; Dunne 
et al., 2003). Tal experimento pode ter 3 grupos de tratamento e 4 replicas por tra- 
tamento (4x3= 12 observances no total). Quatro parcelas sao sem manipulanao, 
nao tendo sido feitas mudannas nas parcelas alem daquelas que ocorrem durante 
o censo. Quatro parcelas sao aquecidas com bobinas de aquecimento permanente 
a energia solar que derretem a neve da primavera mais cedo que o normal. Quatro 
parcelas adicionais atuam como controles: elas sao preenchidas com bobinas de 
aquecimento que nunca sao ativadas. Apos 3 anos de aplicanao do tratamento, 
voce mede o comprimento do periodo de floran&o da esporinha (Delphinium nut- 
tallianum ) em cada parcela. 

Os resultados sao mostrados na Tabela 10.1, junto com todos os calculos ne- 
cessarios para esse exemplo. Embora a maioria dos calculos da ANOVA hoje seja 
feita em um computador, e importante trabalhar a mao nesse exemplo, para voce 
ter um entendimento solido de como a soma dos quadrados e dividida. 

Como descrevemos nos Capitulos 3 e 9, comenamos nossas analises calculan- 
do a soma dos quadrados total dos dados, que e a soma dos desvios quadrados de 
cada observanao (F ; ) para media geral (7). Com um fator, ha de i - 1 ate a trata¬ 
mentos e de; = 1 a n replicas por tratamento, com um total de ax n observances. 
Em nosso exemplo, ha a - 3 tratamentos (sem manipulanao, controle e tratamen¬ 
to) e n - 4 replicas por tratamento, com um tamanho amostral denx« = 3x4 = 
12. Entao, podemos escrever: 

sQ», = IX(^-i F ) 2 (lo-D 

;=i j =i 

A soma dos quadrados total para os dados da Tabela 10.1 e 41,66. 

Essa soma dos quadrados total reflete o desvio de cada observanao da media 
geral. Ela pode ser decomposta (dividida) em duas fontes diferentes. O primeiro 
componente de varianao e a varianao entre grupos. A varianao entre grupos re- 
presenta diferennas entre as medias de cada grupo de tratamento. Pensando na 
media de cada grupo com uma unica observanao, essa fonte de varianao e: 
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TABELA 10.1 Fazendo a parti^ao da soma dos quadrados na ANOVA 


Sem manipula^ao 

Controle 

Tratamento 

10 

9 

12 

12 

11 

13 

12 

11 

15 

13 

12 

16 

F, = 11,75 

Y 2 = 10,75 

y 3 = 14,00 

£ (l^-1*) 2 =4,75 

£(r 2) -F 2 ) 2 =4,75 

n 

J^(Y 3j -Y 3 ) 2 = 10,00 

;=1 

;=1 

;=i 

n 

X(F,-F) 2 = 0,68 

n 

£(F 2 -F) 2 = 8,08 

n 

£(F 3 -F) 2 = 13,40 

1=1 

H 

7=1 

X(1', j -F) 2 = 5,43 

n 

J J (Y 2j -Y) 2 = 12,S3 

n 

X(F;-F) 2 = 23,40 


H 

7=1 


SQ.. m ^='tt d (Y,-Y) 2 ( 10 . 2 ) 

-=i ;=i 

Esta equa^ao contem dois somatorios, um para os grupos de tratamento a e 
um para as n, observances em cada grupo de tratamento. Fazer o primeiro soma- 
torio e facil: pegue a media de cada tratamento, subtraia da media geral, eleve ao 
quadrado e some os termos para cada um dos grupos de tratamentou. Mas como 
“somaremos osj” quando nao ha um subscrito; na equaqao (V, - V) 2 ? Como ha 
n t observances em cada grupo de tratamento, voce apenas multiplica o primeiro 
somatorio pela constante n? Entao, a Equaqao 10.2 e equivalente a: 

a 

SQentresrupos^niWi-Y) 2 

1=1 

Nos delineamentos balanceados que discutimos neste capitulo, e o mesmo 
para todos os grupos de tratamentos (« ; = «), e isto simplifica para: 
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Y= 12,17 

a n 

'L’LWij = 19,50 = SQ denImdegrupos 
<=i H 

XX(V ; i-i 7 * * ) 2 =22,16 = SQ„„ Jr „ p „ 

<=i i=i 

XJl^-F) 2 =41,66 = SQ„„, 


Os dados brutos hipoteticos consistem em observances do 
periodo de flora^ao (em semanas) da esporinha em um con- 
junto de 12 parcelas em prados alpinos. Quatro dessas parce- 
las receberam um tratamento experimental de aquecimento, 
quatro parcelas serviram como controles (os aparelhos de 
aquecimento montados, mas nao sao ligados) e quadro par¬ 
celas nao foram manipuladas. Existem de i = 1 a 3 grupos 
(= tratamentos), com n-4 replicas por grupos. Esta tabela 
ilustra os calculos basicos da ANOVA e a parti^ao da soma 
dos quadrados. Na primeira linha dos calculos, temos a me¬ 
dia geral Y para todas as 12 replicas (12,17) e a media Y t para 
cada grupo de tratamento (11,75,10,75 e 14,00). Na segun- 
da linha de calculos, somamos o desvio quadrado de cada 
observanao da media do proprio grupo ( Y- - Yj) * 2 (4,75,4,75 
e 10,00) e somamos estes termos para obter a soma dos qua¬ 
drados dentro de grupos (19,50). Na terceira linha de calcu¬ 
los, determinamos o desvio quadrado da media de cada gru¬ 
po para a media geral {Y l - Y) 2 * S * multiplicada pelo tamanho 
amostral n-4 (0,68, 8,08 e 13,40) e somamos estes termos 
para obter a soma dos quadrados entre grupos (22,16). Na 
quarta linha de calculos, determinamos o desvio quadrado 
de cada observa^ao para a media geral (5,43, 12,83 e 23,40) 
e somamos estes termos para obter a soma dos quadrados 
total. Assim, a soma dos quadrados total (41,66) pode ser 
aditivamente particionada no componente dentro de grupo 
(19,50) e entre grupos (22,16). Trata-se de uma propriedade 
algebrica fundamental, util para qualquer conjunto de nu- 
meros. Usar tais dados para conduzir um teste estatistico faz 
sentido apenas se a amostragem cumprir os pressupostos 
gerais da ANOVA e se adequar a um delineamento particu¬ 

lar especifico de um modelo de ANOVA. 


No exemplo apresentado na Tabela 10.1, as tres somas dos quadrados para 
os grupos de tratamentos sao 0,17, 2,02 e 3,35. Como ha quatro replicas por tra¬ 
tamento, a soma dos quadrados entre grupos e igual a 4 x (0,17 + 2,02 + 3,35) 
= 22,16. No modelo de ANOVA de um fator, os fatores controlados represen- 
tam processos que acreditamos causar diferen^as entre os grupos de tratamentos. 
O efeito desses fatores sao representados pela soma dos quadrados entre grupos 
(Equa^ao 10.2). 

O componente remanescente e a varia^ao dentro de grupos. Em vez de cal- 
cular o desvio de cada observa<;ao para a media geral, calculamos o desvio de cada 
observa<;ao para a media de seu proprio grupo e depois somamos entre os grupos 
e as replicas: 


a n 

S Qdentro de grupos XIX< 10 - 3 ) 

'■=1 H 

Este componente de varia^ao no conjunto de dados do exemplo e 19,50. 

A soma dos quadrados dentro de grupos geralmente e chamada de soma dos 

quadrados dos residuos, de varia^ao residual ou de varia^ao do erro. Como 
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na regressao, nos referimos a ela como “reslduo”, pois e uma varia^ao que nao 
e explicada pelos fatores controlados, ou experimentais, em nosso modelo. A 
varia^ao dentro de grupos (Equa^ao 10.3) e descrita como “varia^ao do erro” 
porque nosso modelo estatistico incorpora esse componente como amostragem 
aleatoria a partir de uma distribui^ao normal. Em modelos de ANOVA mais 
complexos, iremos fazer a parti^ao da soma dos quadrados total em compo- 
nentes multiplos de varia^ao, cada um representando uma contribui^ao de um 
fator no modelo. Em todos os casos, contudo, o que sobra e sempre a soma dos 
quadrados dos residuos. 

Uma das contribui^oes-chave de Fisher foi mostrar que os componentes de 
varia<;ao sao aditivos: 


SQ 


total 


^Qentregrupos 


SQ, 


dentro de grupos 


(10.4) 


Em palavras, a soma dos quadrados total e igual a dos quadrados entre grupos 
mais a dos quadrados dentro de grupos. Para os dados na Tabela 10.1: 


11 

i=l ;'=1 i=l j=l i'=l ;= 1 

41,66 = 22,16 + 19,50 


(10.5) 


Enfatizamos que a parti^ao da soma dos quadrados e uma propriedade pura- 
mente algebrica: este resultado servira para qualquer conjunto de numeros, inde- 
pendente do que eles representem e de como foram coletados. 1 

Todavia, a part^ao da soma dos quadrados parece ser uma medida natural 
dos efeitos dos tratamentos. Se a soma dos quadrados entre grupos e relativa- 
mente grande se comparada a dos quadrados dentro de grupos, entao as diferen- 
<;as entre tratamentos podem parecer importantes. Por outro lado, se a soma dos 


1 A prova da parti^ao da soma dos quadrados pode ser rapidamente esbo^ada. Primeiro, comece com 
a soma dos quadrados total: 

i=\ j =i 

Agora, vamos adicionar e subtrair de forma que o total nao muda: 

SQ tot a, = H(Yij-Y + Yi-Yi) 2 

i =i ;=i 

Reagrupando os elementos, obtemos os dois componentes familiares da soma dos quadrados: 

SQ t0M , = SX[( y i;-^) + (^- f )] 2 

;=1 ;=1 

Recordando a expansao binomial (ver Capitulo 2), ( a + bf = a + lab 


(Continua) 
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quadrados dentro de grupos e grande em rela^ao a dos quadrados entre grupos, 
concluimos que diferen^as entre grupos sao fracas ou inconsistentes. Veremos, a 
seguir, como quantificar essas ideias na analise de variancias. 

OS PRESSUPOSTOS DA ANOVA 

Antes de utilizarmos a soma dos quadrados em modelos estatisticos, eles precisam 
satisfazer o seguinte conjunto de pressupostos. 

1. As amostras sao independentes e identicamente distribuidas. Como sempre, 
este pressuposto forma a base para qualquer modelo estatistico de amostra- 
gem. Assumimos que os dados representam uma amostra aleatoria do espa^o 
amostral que voce definiu e que as observa^oes dentro e entre tratamentos 
sao independentes entre si ( ver Capitulo 6). Para todas as describes das ta- 
belas de ANOVA deste capitulo, assumimos o caso mais simples, no qual o 
tamanho amostral (n) e o mesmo dentro de todos os grupos. Ver Sokal & Ro- 
hlf (1995) para uma visao geral de metodos de ANOVA quando os tamanhos 
amostrais dos grupos de tratamentos sao desiguais. 

2. As variancias sao homogeneas entre grupos. Embora as medias dos grupos 
amostrados possam diferir entre si, assumimos que a variancia dentro de cada 
grupo e aproximadamente igual aquela dentro de todos os outros grupos. 
Desta forma, cada grupo de tratamento contribui com aproximadamente o 
mesmo tanto para a soma dos quadrados dentro de grupos. Na regressao li¬ 
near, fazemos um pressuposto analogo, de que a variancia e homogenea para 
os diferentes niveis da variavel X (ver Capitulo 9). Alem disso, como na re¬ 
gressao linear, as transforma<;6es dos dados com frequencia tornaram homo¬ 
geneas as variancias ( ver Capitulo 8). 

3. Os restduos tern distribui$ao normal. Assume-se que os residuos seguem a 
distribui^ao normal, com media igual a zero. Gramas ao Teorema do Limite 


1 (Continuagao) 

1=1 j =1 1=1 ;=1 z=l ;=1 

Satisfatoriamente, o segundo termo dessa expansao sempre sera igual a zero (pois a soma dos desvios 
da media = 0; ver Capitulo 9) e ficamos com: 

i =1 j =1 t=l ;=1 t=l 7=1 

A Equa^ao 10.4 pode ser pensada como o Teorema de Pitagoras (ver Nota de rodape 5, Capitulo 12) 
para distancias dos dados ate as medias e entre as medias. A Equa^ao 10.4 garante que a SQ mtregrupos e 
a SQdentrodegrupos se j am ortogonais entre si. Eles nao “fazem sombra” um no outro e sao estatisticamente 
independentes. Essa independence e necessaria para uma interpreta^ao valida das razoes-F e ainda e 
outra vantagem de usar os desvios quadrados para expressar distancia. 
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Central ( ver Capitulo 2), esse pressuposto nao e muito restritivo, especial- 
mente se os tamanhos amostrais sao grandes e aproximadamente iguais en- 
tre tratamentos, ou se os proprios dados forem medias. Novamente, dados 
adequadamente transformados em geral podem ter termos do erro com dis- 
tribui^ao normal. 

4. As amostras sao classificadas corretamente. Para estudos experimentais, as- 
sumimos que todos os individuos atribuidos a um tratamento em parti¬ 
cular foram tratados de maneira identica (p. ex., todos os passarinhos de 
um tratamento livre de parasitas recebem doses identicas de antibioticos). 
Para estudos observacionais, ou experimentos naturais, assumimos que to¬ 
dos os individuos agrupados em uma classe particular realmente perten^am 
aquela classe (p. ex., em um estudo de impacto ambiental, todas as parce- 
las do estudo foram atribuidas corretamente aos grupos impactados e aos 
grupos controles). A viola^o desse pressuposto e potencialmente seria e 
pode comprometer as estimativas dos valores de P. Em estudos de regres- 
sao, a premissa analoga e a ausencia de erros de medidas na variavel X (ver 
Nota de rodape 10, Capitulo 9). Entretanto, os erros de medidas em um 
delineamento de regressao podem nao ser um problema tao serio quanto 
os de classificaqao em um delineamento de ANOVA. Um estudo de grande 
qualidade conduzido com cuidado e a melhor garantia contra erros de clas- 
sifica^ao e de medida. 

5. Os efeitos principals sao aditivos. Em certos delineamentos de ANOVA, como o 
de blocos aleatorizados ou de parcelas subdivididas, nem todos os fatores dos 
tratamentos sao completamente replicados. Nesses casos, e necessario assu- 
mir que os efeitos principals sao estritamente aditivos e que nao ha intera^ao 
entre os diferentes fatores. Trataremos desse pressuposto em detalhes mais 
adiante neste capitulo, quando discutirmos esses delineamentos. As transfor- 
ma^oes dos dados tambem podem ajudar a garantir aditividade, em especial 
quando fatores multiplicativos sao transformados logaritmicamente ( ver Ca¬ 
pitulo 3). 

TESTES DE HIPOTESES COM ANOVA 

Se os pressupostos da ANOVA sao cumpridos (ou nao sao violados de maneira 
grave), podemos testar hipoteses com base em um modelo subjacente que e ajus- 
tado aos dados. Para a ANOVA de um fa tor, o modelo e: 

Y-. = p + A i + £•• (10.6) 

Neste modelo, Y i} e a replica; associada ao nivel de tratamento i, p e a media 
geral verdadeira, ou a media aritmetica [(y) e a estimativa de p] e £ y e o termo 
do erro. Embora cada observa^ao Y (/ possua seu proprio erro 8 i; associado, lem- 
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bre-se de que todos os £- sao retirados de uma distribui^ao normal unica com 
uma media 0.0 elemento mais importante do modelo e o termo A r Este termo 
representa o componente linear aditivo associado ao nivel i do tratamento A. 
Ha um diferente coeficiente A, associado a cada um dos i niveis de tratamento. 
Se A, e um numero positivo, o nivel de tratamento i tern uma expectativa que e 
superior a media geral. Se A, e negativo, a expectativa esta abaixo da media geral. 
Como os A ( representam desvios da media geral e, por defini<;ao, a sua soma e 
igual a zero. A ANOVA nos per mite estimar os efeitos do A, (a media dos trata- 
mentos menos a media geral constituem um estimador imparcial do A,) e testar 
hipoteses sobre os A ( . 

Qual e a hipotese nula? Se nao ha nenhum efeito dos tratamentos, entao A, = 0 
para todos os niveis do tratamento. Portanto, a hipotese nula e: 

^ = H + e,) (10-7) 

Se a hipotese nula e verdadeira, qualquer varia^ao que ocorra entre os grupos 
de tratamentos (e sempre havera alguma) reflete o erro aleatorio e nada mais. 

A tabela de ANOVA fornece um teste geral da hipotese nula de ausencia 
de efeitos do tratamento. A Tabela 10.2 mostra os componentes basicos da ta¬ 
bela de ANOVA para o delineamento de um fator ( ver “A Anatomia de uma 
Tabela de ANOVA” no Capitulo 9 para os detalhes e abrevia 9 oes de uma tabela 
de ANOVA tipica). Come^amos calculando o quadrado medio, que e simples- 
mente a soma dos quadrados dividida pelos seus graus de liberdade corres- 
pondentes (ver Capitulo 9). Dois quadrados medios sao calculados em uma 
ANOVA de um fator. 

O primeiro quadrado medio, para a varia^ao entre grupos, possui (a - 1) 
graus de liberdade, onde a e o numero de tratamentos. O segundo quadrado 
medio, para a varia^ao dentro de grupos, possui a(n - 1) graus de liberdade. 
Isso tern sentido intuitivo, porque, dentro de cada grupo, deveria ter (n - 1) 
graus de liberdade. Com a grupos, temos a(n - 1) graus de liberdade para o 
quadrado medio dentro de grupos. Alem disso, note que os graus de liberdade 
total = (a - 1) + a(n - 1) = (an - 1), justamente um a menos que o tamanho 
amostral total. Por que os graus de liberdade nao somam o mesmo que o tama¬ 
nho amostral total (nn)? Porque um grau de liberdade e usado para estimar a 
media geral (|i). 

Enquanto o quadrado medio dentro de grupos estima a variancia do erro 
a 2 , o quadrado medio entre grupos estima a 2 + <5 2 A : a variancia do erro mais a 
variancia devido aos grupos de tratamento. Portanto, a razao entre essas duas 
quantidades ( QM entr JQM dentro ) e um teste apropriado do efeito do tratamento. 
Quanto maior o efeito do tratamento em rela^ao ao erro quadrado dentro do 
grupo, maior sera a razao-F. Se nao ha efeito dos tratamentos (o 2 A = 0) (a hipotese 
nula), entao o quadrado medio entre grupos = a 2 + 0 = a 2 , que e o mesmo que o 
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TABELA 10.2 Tabela de ANOVA para um esquema 

de um fator 



Fonte 

Graus de 
liberdade 
(gD 

Soma dos 
quadrados (SQ) 

Quadrado 
medio (QM) 

Quadrado 

medio 

esperado 

Razao-F 

Valor de P 

Entre 

a- 1 

Ilo'-n 2 

;=i j=i 

SO 

Centre grupos 

c 2 + no 2 A 

QM entre g rU p 0S 

Cauda da 
distribui<;ao F 
com (a - 1) e 
a{n- 1) graus 
de liberdade 

grupos 

(a- 1) 

Q'Mfcntro de grupos 

Dentro 
de grupos 
(residuo) 

a(n- 1) 

ZXVrV 2 

>'= 1 J =1 

SQdentro de grupos 

a(n — 1) 

a 2 



Total 

an - 1 

iior,-rr 

i =1 i =1 

SQwtci 

(an — 1) 

a 2 




Ha a grupos, com n replicas por grupo. A i e o efeito do tratamento para o grupo i. O fator de agrupamento pode ser ou 
fixo ou aleatorio. Neste delineamento simples, ha apenas uma unica razao-F que pode ser construida, a qual testa a hipo- 
tese nula de que a varia^ao entre grupos amostrados nao e significativamente diferente de 0. A razao-F utiliza o quadrado 
medio entre grupos no numerador e o quadrado medio dentro de grupos (residuo) no denominador. Ver a Tabela 9.1 
para explicates adicionais sobre os elementos de uma tabela de ANOVA. 


quadrado medio dentro de grupos, ou a variancia do erro CT. Neste caso, QM entre 
= QM dentro , e a sua razao, a razao-F, = 1,0. A probabilidade de cauda depende tanto 
do tamanho da razao-F quanto dos graus de liberdade. Para a ANOVA de um 
fator, ha (a - 1) graus de liberdade no numerador e a (n- 1) graus de liberdade 
no denominador. 

Para os dados da Tabela 10.1, a razao-F e 5,11, com um valor de P correspon- 
dente de 0,033 (Tabela 10.3). O valor de P e pequeno (menor que 0,05), entao 
podemos rejeitar a hipotese nula de ausencia de efeito do tratamento. Quando 
olhamos para os dados brutos (Tabela 10.1), parece ser apropriado rejeitar a hipo¬ 
tese nula: os periodos de flora^ao foram maiores no grupo de tratamento que no 
grupo controle ou no sem manipula^ao. 

C0NSTRUIND0 RAZ0ES-F 

Aqui estao os passos gerais para construir uma razao-F e usa-la para testar hipo- 
teses utilizando ANOVA: 

1. Use os quadrados medios associados a um modelo de ANOVA que se ajuste 
ao seu delineamento amostral ou experimental. Apresentamos os delinea- 
mentos basicos no Capitulo 7 e neste (10) daremos as tabelas de ANOVA que 
os acompanham. Esperamos que siga nosso conselho nos Capitulos 4 e 6 e 
construa seu modelo antes de coletar seus dados! 
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TABELA 10.3 Tabela de ANOVA de um fator para os dados hipoteticos da 
Tabela 10.1 


Fonte 

Graus de 
liberdade (gl) 

Soma dos 
quadrados (SQ) 

Quadrado 
medio (QM) 

Razao-F 

Valor de P 

Entre grupos 

2 

22,17 

11,08 

5,11 

0,033 

Dentro de grupos 

9 

19,50 

2,17 



(residuo) 






Total 

11 

41,67 





As formulas na Tabela 10.2 sao usadas para calcular as somas dos quadrados, os quadrados medios e a 
razao-F. A primeira coluna indica a fonte de varia<;ao. A segunda coluna indica os graus de liberdade, que 
sao determinados pelo tamanho amostral e pelo numero de grupos sob compara^ao. A terceira coluna 
fornece as somas dos quadrados, que foram calculadas na Tabela 10.1. A quarta coluna e o quadrado medio, 
calculado dividindo cada soma dos quadrados pelo seu numero de graus de liberdade correspondente. A 
coluna seguinte fornece a razao-F, calculada como a razao entre os valores dos quadrados medios apropria- 
dos. Para uma simples ANOVA de um fator, a unica razao-F que pode ser construida testa a varia<;ao entre 
grupos, ela e calculada como (o quadrado medio entre grupos)/(pelo quadrado medio dentro de grupos). 
O valor de P e determinado a partir de um conjunto de tabelas estatisticas para uma razao-F com 2 e 9 
graus de liberdade. O valor de P indica que ha somente 3,3% de chance em obter esses dados (ou outros 
dados ainda mais extremos) se a hipotese nula for verdadeira. Como esse valor de P e menor que o nivel 
padrao do alfa de 0,05, rejeitamos a hipotese nula e concluimos que a varia^ao entre grupos provavelmente 
e maior do que pode ser explicado somente por chance. 


2. Encontre o quadrado medio esperado que inclui o efeito em particular que 
voce esta tentando medir e use-o no numerador da razao-F. 

3. Encontre o segundo quadrado medio esperado que inclui todos os termos 
estatisticos no numerador, com exce^do do unico termo que voce esta tentando 
estimar, e use-o no denominador da razao-F. 

4. Divida o numerador pelo denominador e obtenha sua razao-F. 

5. Use tabelas estatisticas ou o resultado do seu computador, determine o valor 
de probabilidade (valor de P) associado a razao-F e seus graus de liberdade 
correspondentes. A hipotese nula sempre e de que o efeito de interesse e zero. 
Se a hipotese nula e verdadeira, a razao-F construida adequadamente em geral 
tera um valor esperado de 1,0. Em contrapartida, se o efeito e muito grande, 
o numerador sera muito maior que o denominador e produzira uma razao-F 
que e consideravelmente superior a 1,0. 2 

6. Repita os passos de 2 a 5 para os outros fatores que estiver testando. Uma 
ANOVA simples de um fator gera apenas uma unica razao-F, mas modelos 
mais complexos permitem que voce teste multiplos fatores. 


2 As razoes-F menores que 1,0 teoricamente tambem sao possiveis - tal resultado indicaria que as 
diferen<;as entre medias dos grupos na verdade sao menores que o esperado por chance. As razoes-F 
muito pequenas refletem uma falha em obter amostras aleatorias independentes. Por exemplo, se a 
mesma replica for medida equivocadamente em mais de um grupo de tratamento, a soma dos qua¬ 
drados entre grupos sera pequena (ver tambem Nota de rodape 6, Capitulo 5). 
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TABELA 10.4 Tabela de ANOVA para o delineamento de blocos aleatorizados 


Fonte 

Graus de liberdade (gl) 

Soma dos quadrados ( SQ ) 

Quadrado medio (QAf) 

Entre grupos 

a- 1 

i=l j= 1 

SO 

Centre grupos 

(a- 1) 

Blocos 

b- 1 

<=1 M 

SQblocos 

(b- 1) 

Dentro de 

grupos 

(residuo) 


;=1 ;=1 

SO 

^ dentro de grupos 

(a-W-1) 

Total 

ab- 1 

i=l ;= 1 

S Q,otal 

(ab- 1) 


Existem de i = 1 ate a grupos de tratamentos e de j = 1 ate b blocos, com cada grupo de tratamento repre- 
sentado uma unica vez dentro de um bloco. O efeito do tratamento e fixo e o dos blocos, aleatorio. Dois tes¬ 
tes de hipoteses sao possiveis, um para diferen^as entre tratamentos e outro para diferen^as entre blocos. Os 
dois testes utilizam o quadrado medio dos residuos no denominador da razao-F. Como nao ha replica^ao 
dentro do bloco em um delineamento de blocos aleatorizados, nao ha teste para a intera^ao entre blocos e 
tratamentos - uma limita^ao importante desse modelo. 


A maioria dos programas estatisticos dara todos esses passos para voce. En- 
tretanto, voce deveria gastar um tempo para examinar os valores numericos das 
razoes-F, e se convencer de que eles foram calculados corretamente. Como ex- 
plicaremos, as configura^oes-padrao em muitos pacotes estatisticos podem nao 
gerar as razoes-F corretas para o seu modelo em particular. Fique atento! 

UM BESTIARIO DE TABELAS DE ANOVA 

Aqui, apresentamos e descrevemos com brevidade as tabelas de ANOVA e os 
testes de hipoteses para os outros delineamentos de ANOVA, discutidos no Ca- 
pitulo 7. Tambem apresentamos um novo delineamento, a ANCOVA, agora que 
voce ja aprendeu sobre regressao (no Capitulo 9). 

Blocos aleatorizados 

No delineamento de blocos aleatorizados, cada conjunto de tratamentos e fisica 
ou espacialmente agrupado em um bloco (ver Figura 7.6), com cada tratamento 
representado apenas uma vez em cada bloco. Existem de a = 1 ate i grupos de 
tratamentos e de j = 1 ate b blocos, portanto o tamanho amostral total e de A ob¬ 
servances. O modelo em teste e: 
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Quadrado medio esperado Razao-F 


Valor de P 


g 2 + bo 2 A 


QM 


entre grupos 


QM 


dentro degrupos 


Cauda da distribui^ao F 
com (a - 1), (a - l)(b- 1) 
graus de liberdade 


a 2 + aa 2 B 


QM, 


bloco 


QM, 


dentro degrupos 


Cauda da distribui^ao F 
com (b- 1), {a - l)(b- 1) 
graus de liberdade 


a 


2 


a 


2 

Y 


y.. = (X + A- + £ ; + Ejj (10.8) 

Em adi^ao ao termo aleatorio de erro £ () e ao efeito do tratamento A : , existe 
agora um efeito de bloco B-. os valores medidos em alguns blocos sao consisten- 
temente maiores ou menores do que em outros blocos, acima e alem dos efei- 
tos do tratamento A r Note que nao ha termo de intera^ao incluido para blocos 
e tratamentos. Tal intera^ao pode evidentemente existir, embora nao possamos 
estima-la: ela permanece escondida tanto na soma dos quadrados do erro quanto 
na dos quadrados do tratamento. 

A tabela de ANOVA para o delineamento de blocos aleatorizados (Tabela 
10.4) contem a soma dos quadrados usual para diferen^as entre medias dos tra¬ 
tamentos, mas a dos quadrados para as diferen^as entre blocos, que possui (b - 1) 
graus de liberdade. Esta e calculada primeiramente obtendo a media de todos os 
tratamentos dentro de cada bloco e depois medindo a varia<;ao entre eles. A soma 
dos quadrados do erro agora contem (a - 1 )(b - 1) graus de liberdade. Para a 
ANOVA de um fator correspondente, com n-b replicas por tratamento, havera 
(a - 1 ){b) graus de liberdade. Esses numeros diferem por {a - 1) graus de liberda¬ 
de, que sao utilizados para estimar o efeito do bloco. 

Duas hipoteses nulas podem ser testadas com o delineamento de blocos 
aleatorizados. A primeira propoe que nao ha diferen^as entre blocos. A razao-F 
utilizada para testar essa hipotese e QM entreblo JQM dentrodosblocos . Testar os efeitos 
do bloco em geral nao e de interesse; a principal razao de usar delineamentos 
em bloco e que esperamos por diferen^as entre blocos e queremos ajustar essas 
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diferen^as na nossa compara^ao de tratamentos. A segunda hipotese nula, a 
que geralmente estamos mais interessados, e que nao ha diferen^as entre tra¬ 
tamentos. A razao-F utilizada para testar essa hipotese e calculada da manei- 
ra usual QM entregrupo JQM dentrodegrupos . Entretanto, como vimos anteriormente, o 
quadrado medio dentro de grupos possui menos graus de liberdade que o do 
erro de um fator simples na ANOVA. A razao e que alguns graus de liberdade 
originais do erro foram utilizados para estimar o efeito do bloco. Se as dife- 
ren<;as entre os blocos sao grandes, a redu<;ao na soma dos quadrados entre 
grupos sera consideravel e o teste para o efeito do tratamento, mais poderoso, 
mesmo com reduzidos graus de liberdade. Entretanto, se as diferen<;as entre 
blocos sao pequenas, a redu<;ao na soma dos quadrados entre grupos sera di- 
minuta e o teste para o efeito do tratamento menos poderoso. Se os efeitos do 
bloco sao fracos, teremos desperd^ado os (a - 1) graus de liberdade necessa- 
rios para estima-los. 

ANOVA aninhada 

No delineamento aninhado, os dados sao organizados hierarquicamente, com 
uma classe de objetos dentro de outra ( ver Figura 7.8). Um exemplo familiar e 
a classifica^ao taxonomica, na qual as especies sao agrupadas dentro de generos 
e estes, agrupados dentro de familias. O aspecto-chave para reconhecer um deli¬ 
neamento aninhado e que os subgrupos nao se repetem em categorias de niveis 
superiores. Por exemplo, os generos de formiga Myrmica, Aphaenogaster e Phei- 
dole ocorrem somente dentro da subfamilia de formigas Myrmicinae; eles nao sao 
encontrados na subfamilia Dolichoderinae ou na subfamilia Formicinae. Simi- 
larmente, os generos de formiga Formica e Camponotus sao encontrados somente 
na subfamilia Formicinae. Os delineamentos aninhados podem lembrar superfi- 
cialmente os do tipo cruzados ou ortogonais. No entanto, em um delineamento 
ortogonal adequado, todo o nivel de um fator e representado com cada um dos 
niveis de outro fator. No Capitulo 7, nosso exemplo de delineamento cruzado foi 
um experimento de adi^ao de nitrogenio e fosforo, no qual cada nivel de nitroge- 
nio foi pareado com cada nivel de fosforo. 

E importante reconhecer as diferen<;as nesses delineamentos, porque eles re- 
querem diferentes niveis de analise. Embora existam muitas varia^oes de delinea¬ 
mentos aninhados, utilizaremos o mais simples possivel, em que um investigador 
usa duas ou mais subamostras com uma replica de uma ANOVA de um fator. 
Desse modo, havera de i - 1 ate a niveis de tratamentos, de j - 1 ate b replicas 
dentro de cada nivel do tratamento e de k - 1 ate n subamostras dentro de cada 
replica. O tamanho amostral total (para o delineamento balanceado) e axbxn. 
O modelo a ser testado e: 


Y ijk~^ + A i + B j(i) + e ijk ( 10 * 9 ) 

A, e o efeito do tratamento e B j(i) e a varia^o entre replicas, as quais sao aninha- 
das dentro dos tratamentos. O simbolonos lembra que a replica do nivel; e ani- 
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nhada dentro do nivel i do tratamento. Por fim, e ijk e o termo de erro aleatorio, indi- 
cando o erro associado a subamostra k, a replica j e ao tratamento i. Correspondendo 
a esses tres niveis de varia^ao, temos tres quadrados medios na tabela de ANOVA: va- 
ria^ao entre tratamentos, varia^ao entre replicas dentro de um tratamento e varia^ao 
do erro. Esta e calculada para as subamostras dentro de cada replica (Tabela 10.5). 

A caracteristica mais importante na tabela de ANOVA para delineamentos 
aninhados e a razao-F para o efeito do tratamento. O denominador dessa razao-F 
e o quadrado medio para as replicas dentro de um tratamento - e nao o usual 
denominador de variancia do erro. A razao e que as subamostras individuais sao 
agrupadas dentro das replicas, entao elas nao sao independentes uma da outra. 
Este QM dentrodegrupos e apropriado para testar diferen^as entre replicas dentro de um 
tratamento, mas nao para testar diferen^as entre tratamentos. O calculo correto 
para o efeito do tratamento possui apenas a(b - 1) graus de liberdade no denomi¬ 
nador, representando a varia^ao independente entre as replicas. 

O resultado do teste de ANOVA aninhada para diferen^as entre tratamentos 
seria algebricamente identico a uma ANOVA simples de um fator, em que voce 
primeiro calcula a media das subamostras dentro de uma replica. Essa ANOVA 
de um fator tambem teria a(b - 1) graus de liberdade no denominador, os quais 
correspondem ao numero de replicas verdadeiramente independentes. 

Em contraste, se voce erroneamente utilizar o QM dentr0 de grupos para testar os 
efeitos dos tratamentos em um delineamento aninhado, voce tera ab(n - 1) graus 
de liberdade, que e consideravelmente maior e mais provavel de causar uma re- 
jei^ao incorreta da hipotese nula (um erro Tipo I). A escolha do denominador 
correto para a razao-F se torna clara quando voce examina o quadrado medio 
esperado na tabela de ANOVA. 3 

A analise que apresentamos aqui representa o delineamento aninhado mais sim¬ 
ples possivel. Muitos outros delineamentos incluem misturas de fatores aninhados 
e cruzados, e aqueles de parcelas subdivididas e os de medidas repetidas podem ser 
interpretados como formas especiais de delineamentos aninhados. Nosso conse- 


" Alguns autores sugerem que a variancia dentro de tratamentos pode ser agrupada sob certas cir- 
cunstancias. Suponha que o teste da varia^ao entre replicas dentro de um tratamento seja nao 
significativo. Entao e tentador agrupar a variancia e tratar cada subamostra como uma replica 
verdadeiramente independente. Com certeza, isso aumentara o poder do teste para o efeito do 
tratamento, e tambem a chance de erro Tipo I se realmente houver varia^ao entre as replicas. O 
nivel critico para tomar a decisao de agrupar e em geral muito maior (p. ex., a = 0,25) para reduzir 
a probabilidade de aceitar incorretamente a hipotese nula de ausencia de varia^ao entre as replicas 
(um erro Tipo II). 

Nosso conselho e nao agrupar dados. A escolha de um nivel de a para uma decisao de agru¬ 
par e razoavel, porem arbitraria (Underwood, 1997). Achamos que voce deve ficar com a ANOVA 
aninhada, que verdadeiramente reflete a estrutura dos seus dados. Como destacamos no Capitulo 
7, o delineamento aninhado nao lhe confere qualquer poder adicional para detectar os efeitos do 
tratamento e parece perigoso tentar e comprimir os graus de liberdade adicionais para fora da 
analise depois do fato. Se for logicamente possivel, uma outra estrategia e reduzir ou eliminar as 
subamostragens de seu delineamento e aumentar o numero de replicas verdadeiramente indepen¬ 
dentes para estimar o efeito do tratamento. Mais uma vez, esta e uma decisao que deve ser resolvida 
antes de voce coletar seus dados. 
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TABELA 10.5 Tabela de ANOVA para um delineamento aninhado 


Fonte 

Graus de liberdade (gl) 

Soma dos quadrados (SQ) Quadrado medio (QM) 

Entre grupos 

a- 1 

abn 

III (i'-i 7 ) 2 

;=i 7=i k =i 

SO 

Centre grupos 

(a-l) 

Entre replicas 
dentro de 
grupos 

a(b - 1) 

;=l j=\ k=\ 

^ Q replicas(grupos) 

a(b- 1) 

Subamostras 
dentro das 
replicas (residuo) 

ab(n - 1) 

j=l ;= 1 k= 1 

SQ subamostras 

ab{n — 1) 

Total 

abn - 1 

abn 

II Ic*V-n 2 

i =1 ;=1 k =1 

SQ total 

(abn- 1) 


Ha de i = 1 ate a grupos de tratamentos, de j = 1 ate b replicas aninhadas dentro de cada grupo de tra- 
tamento e de k = 1 ate n subamostras aninhadas dentro de cada replica. O fator entre grupos e fixo e as 
replicas dentro de grupos sao tratadas como fatores aleatorios. Note que o teste para o efeito do trata- 
mento usa o quadrado medio entre replicas, e nao o quadrado medio do residuo. O quadrado medio dos 
residuos (subamostras) e um denominador no teste da varia^ao entre replicas dentro de tratamentos. Um 
erro comum em analises de delineamentos aninhados e tratar as subamostras como independentes (o 
que elas nao sao) e usar o quadrado medio dos residuos no denominador da razao-F para testar o efeito 
dos tratamentos. 


lho e evitar delineamentos complicados com alguns fatores aninhados e cruzados. 
Em alguns casos, nem mesmo sera possivel construir um modelo de ANOVA vali- 
do para esses delineamentos. Se seus dados estao organizados em um delineamento 
aninhado complicado, voce sempre podera analisar as medias das subamostras nao 
independentes — com frequencia isso ira colapsar seu delineamento em um modelo 
mais simples. Como discutimos no Capitulo 7, a media das subamostras reduz o 
seu tamanho amostral aparente, mas preserva os graus de liberdade verdadeiros e a 
replica^ao independente, necessaria para testes de hipoteses validos. 

ANOVA de dois fatores 

Retornamos ao exemplo de delineamento com dois fatores do Capitulo 7: um 
estudo do recrutamento de cracas onde um fator e o substrato (3 niveis: cimen- 
to, ardosia e granito) e o segundo fator e preda^ao (4 niveis: sem manipulaqao, 
controle, exclusao de predador e inclusao de predador). Ha de / = 1 ate a niveis 
do primeiro fator, de j = 1 ate b niveis do segundo fator e de k = 1 ate n replicas 
de cada combina^ao ij unica dos tratamentos. Existem ab combina^oes unicas 
de tratamentos e um total de a x b x n replicas. No exemplo do Capitulo 7, a - 3 
niveis de substratos, b = 4 niveis de preda^ao e n = 10 replicas por combina^ao de 
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Quadrado medio esperado 

Razao-F 

Valor de P 

a 2 +bna 2 A +no 2 B{A) 

Q M entre grupos 

Cauda da distribui^ao F 
com (a - 1), a(b - 1) graus 
de liberdade 

Q M entre replicas (grupos) 

o~ + n o 2 B{A) 

QM en tre replicas (grupos) 

Cauda da distribui^ao F 
com a{b- 1 ),ab(n- 1) 
graus de liberdade 

QM su b amostras 

a 2 







tratamentos. Ha ab = (3)(4) = 12 combina^oes linicas de tratamentos e um tama- 
nho amostral total d e axbxn- (3)(4)( 10) = 120 (ver Figura 7.9). 

Em vez de um unico quadrado medio para representar o efeito do tratamento 
como na ANOVA de um fator, ha, agora, tres quadrados medios para os fatores de 
tratamentos. Ha uma soma dos quadrados e um quadrado medio para cada efeito 
principal, ou grupo de tratamento: um para o substrato com (a - 1) = 2 graus de 
liberdade e um para preda^ao com (b- 1) -3 graus de liberdade. Essas somas dos 
quadrados sao usadas para testar diferen^as nas medias de cada fator, exatamente 
como na ANOVA de um fator. 

Entretanto, uma diferen^a sutil e que a soma dos quadrados, associada ao efei¬ 
to principal do substrato na ANOVA de dois fatores, e calculada tirando a media 
de todos os niveis de preda^ao. De forma similar, a soma dos quadrados associada 
ao efeito principal de preda^ao e calculada tirando a media de todos os niveis de 
substrato. Em contraste, o efeito principal da ANOVA de um fator simplesmente 
tira a media das replicas dentro de cada tratamento, pois nao ha um segundo fator 
presente no delineamento experimental. 4 


4 E claro, este segundo fator ainda esta presente na natureza, mas ele nao foi incorporado ao delinea¬ 
mento. O delineamento de um fator pode restringir o experimento a apenas um nivel do outro fator. 
Por exemplo, um delineamento de um fator para o experimento de preda^ao pode ser conduzido 
somente em substratos naturais. Como alternativa, o delineamento de um fator pode nao controlar 
explicitamente o segundo fator. Entretanto, se o delineamento incluir aleatoriza^ao e replica^ao ade- 
quadas (ver Capitulo 6), o segundo fator apenas contribuira para a varia^ao do residuo. Por exemplo, 
o delineamento de um fator para o experimento de substrato ignora a preda^ao, mas se as replicas 
forem independentes entre si e colocadas de forma aleatoria, o efeito da preda^ao sera um compo- 
nente nao explicado da varia^ao residual. 









324 Nicholas J. Gotelli e Aaron M. Ellison 


Em adi^ao aos quadrados medios dos dois efeitos principais, ha um tercei- 
ro efeito que e estimado na ANOVA de dois fatores: a intera^ao entre ambos. O 
efeito de intera^ao mede diferen^as nas medias dos grupos de tratamentos que 
nao podem ser preditas em bases aditivas dos dois efeitos principais. Quantifi- 
car os efeitos de intera^ao de dois ou mais tratamentos em geral e a razao-chave 
para conduzir um experimento multifatorial ou um estudo amostral. Poste- 
riormente, neste capitulo, estudaremos o efeito de intera<;ao em mais detalhes. 
Por agora, apenas notaremos que o efeito de intera<;ao possui (a - 1 ){b - 1) 
graus de liberdade. No exemplo das cracas, esse efeito possui (3 - 1)(4 — 1) =6 
graus de liberdade. 

Os dois efeitos principais e o termo de intera«;ao aparecem como elementos 
em nosso modelo: 

Y ijk = P + A- + B j + AB ij + e ijk (10.10) 

Seguindo nosso procedimento para construir razoes-F, cada um dos quadra¬ 
dos medios correspondentes sera usado no numerador e o termo do erro sera 


TABELA 10.5 Tabela de ANOVA para um delineamento aninhado 


Fonte 

Graus de liberdade (gl) Soma dos quadrados (SQ) 

Quadrado medio (QM) 

Fator A 

a- 1 

abn 

i=i j= i *=i 

SQa 

(a- 1) 

Fator B 

b- 1 

a b n 

i= 1 7=1 k= 1 

SQ fl 
(b~ 1) 

Intera<;ao 

1 

1 

<3 

i'=l j=l k= 1 

SQab 

(Ax B) 

"5 s 

i 

i 

Dentro de 

grupos 

(residuo) 

ab(n -1) 

±i±v*-v 2 

i= 1 7=1 k= 1 

^Qdentro de grupos 

ab(n - 1) 

Total 

abn - 1 

a b n 

,=i j=\ k= i 

SQtotal 

{abn — 1) 


Ha de i = 1 ate a niveis do Fator A, de; = 1 ate b niveis do Fator Ben replicas de cada combina<;ao unica 
de tratamentos ij. Como os Fatores A e B sao fixos, os efeitos principais e os da intera^ao sao todos testados 
contra o quadrado medio dos residuos. Este modelo e o resultado padrao de quase todos os pacotes estatis- 
ticos, embora em muitos delineamentos os Fatores AouB possam ser aleatorios, e nao fixos. 
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sempre utilizado no denominador (Tabela 10.6). Para o delineamento de dois fa- 
tores, os graus de liberdade do termo do erro no denominador sera ab{n - 1) = 
(4)(3)(9) = 108 graus de liberdade. Contudo, esse procedimento padrao para a 
ANOVA de dois fatores e valido apenas se ambos forem conhecidos por efeitos 
fixos. Se forem de efeitos aleatorios, o quadrado medio esperado muda e temos 
que construir razoes-F diferentemente. Primeiro, trabalharemos com tabelas ti- 
picas de ANOVA para fatores fixos e, entao, retornaremos a esse problema poste- 
riormente, quando discutirmos fatores aleatorios e fixos. 

Por fim, e instrutivo contrastar o delineamento de dois fatores para esses 
dados (2 fatores com 4 e 3 niveis de tratamento, respectivamente) com o deli¬ 
neamento de um fator correspondente (1 fator com 12 niveis de tratamento). 
No delineamento de um fator, o termo de erro possui a(n - 1) = 12 (10 - 1) 
= 108 graus de liberdade. Para o delineamento de dois fatores, os graus de 
liberdade do denominador para o termo de erro sao ab(n - 1) = (4)(3)(9) 
= 108 graus de liberdade. Portanto, os calculos dos graus de liberdade e dos 
quadrados medios sao identicos, independentemente se analisamos os dados 
como uma configura^ao de um fator ou como uma configura^ao de dois fato¬ 
res adequada. 


Quadrado medio esperado 

Razao-F 

Valor de P 

a 2 + nbc A 

qm a 

Cauda da distribui^ao 

F com (a - 1 ),ab(n- 1) 
graus de liberdade 

Q M den,ro dos grupos 

G -I - ttClG B 

qm b 

Q^^dentro dos grupos 

Cauda da distribui^ao 

F com ( b - 1 ),ab(n- 1) 
graus de liberdade 

G 2 +no 2 AB 

QM A b 

Q^^dentro dos grupos 

Cauda da distribui^ao F 
com (a- 1 )(b- 1 )>ab(n- 
1) graus de liberdade 


a- 


Gi 
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Compare com cuidado os graus de liberdade para os efeitos do tratamento 
nesses dois modelos. Para o delineamento de dois fatores, se voce adicionar os 
graus de liberdade dos dois efeitos principals e da intera<;ao tera: 2 (efeito prin¬ 
cipal de substrato) + 3 (efeito principal de preda 9 &o) + 6 (intera^ao preda^ao x 
substrato) = 11. Esse e o mesmo numero de graus de liberdade que tinhamos no 
delineamento de um fator com 12 niveis de tratamento. Alem disso, voce poderia 
encontrar que a soma dos quadrados desses dois termos tambem possui o mesmo 
valor. Efetivamente fizemos a parti<;ao dos graus de liberdade dos tratamentos 
da ANOVA de um fator em componentes que refletem a estrutura logica de um 
esquema para dois fatores. 

ANOVA para delineamentos com tres fatores e para n-fatores 

Em teoria, o delineamento de dois fatores pode ser estendido para qualquer nu¬ 
mero de fatores. Cada fator possui niveis diferentes de fatores e todos os trata¬ 
mentos sao completamente cruzados. Cada nivel de um tratamento e aplicado 
com cada nivel de todos os outros tratamentos, ate que todas as combina^oes 
sejam representadas. Por exemplo, um experimento de tres fatores que mani- 
pula a presen^a ou ausencia de herbivoros, carnivoros e predadores (Tabela 7.3) 
possui dois niveis para cada um dos tres fatores. No modelo de tres fatores, ha 
uma media geral (|i), tres efeitos principals (A, B, C), tres pares de intera<;6es 
(AB, AC, BC ), um termo de intera^ao de tres fatores (ABC) e um termo do erro 
(e). O modelo e: 

Y ijki ~ f 1 + A i + B j +c k + AB ij + AC ik + BC jk + ABC ijk + e ijki ( 1 0.11) 

Os efeitos principais de herbivoro, carnivoro e predador possuem cada um 
(a - 1) graus de liberdade (1 neste exemplo). Os termos de intera«;ao em pares 
representam os efeitos nao aditivos de cada par de fatores troficos possivel. Cada 
um desses termos de intera^ao possui (a - 1 )(b - 1) graus de liberdade (esta 
expressao tambem e igual a 1 neste exemplo). Por fim, ha um unico termo de 
intera^ao de tres fatores com (a - 1 )(b - l)(c - 1) graus de liberdade (coinci- 
dentemente tambem e igual a 1 neste exemplo). Como anteriormente (com um 
modelo de efeitos fixos), todos os efeitos principais e os termos de intera^o sao 
testados utilizando o termo de erro como quadrado medio do denominador 
(Tabela 10.7). 

ANOVA de parcelas subdivididas 

No delineamento de parcelas subdivididas ( split-plot ), os tratamentos de um fa¬ 
tor sao agrupados espacialmente juntos, como em um delineamento de blocos 
aleatorizados. Um segundo tratamento e entao aplicado ao bloco ou a parcela 
inteira (ver Figura 7.12). No exemplo das cracas, no Capitulo 7, o fator completo 
da parcela e a preda^ao, pois o bloco inteiro e cercado ou manipulado. O fator de 
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dentro da parcela e o substrato, pois cada tipo de substrato e representado dentro 
de cada bloco. O modelo e: 

Y ijk = P + A + B j(i) + C k + AC ik + CB kj(i) [ + e ijJ (10.12) 

O tratamento completo das parcelas e A ( -, as parcelas diferentes (aninhadas 
dentro do fator A) sao B j(i) , o fator dentro das parcelas e Q. e o termo de erro e 
8 jjkl . Apresentamos esse termo de erro entre colchetes para elucidar o modelo 
completo, mas ele nao pode ser isolado nesse modelo, pois nao ha replica^ao 
do fator C dentro dos blocos (cada nivel de C e representado apenas uma vez 
dentro de um bloco). 

Dois termos de erro diferentes sao usados para testar hipoteses no delinea- 
mento de parcelas subdivididas. Para testar os efeitos do tratamento completo A, 
utilizamos o quadrado medio dos blocos B j(i) como denominador da razao-F. Isso 
porque os blocos inteiros servem como replicas independentes em rela^ao aos 
tratamentos da parcela completa. 

O tratamento C dentro da parcela e testado contra o termo de intera^ao C x 
B, assim como a intera^ao A x C (Tabela 10.8). Como na ANOVA de dois fatores 
padrao, este modelo gera razoes-F e testes de hipoteses para os efeitos principais 
A, C e para a intera^ao entre eles (A x C). Entretanto, como o termo do erro resi¬ 
dual (£■*,) nao poder ser completamente isolado, o modelo de parcelas subdividi¬ 
das assume que nao ha intera^ao entre o fator C e as subparcelas (CB kj(i) = 0; ver 
Underwood, 1997, pagina 393ff, para uma discussao completa). 

ANOVA de medidas repetidas 

O delineamento de medidas repetidas e aquele no qual multiplas observances sao 
tomadas em um unico individuo ou replica. Se ha muita variabilidade de uma re¬ 
plica para a proxima, esta tecnica controla essa fonte de varianao. Contudo, as ob¬ 
servances repetidas em um mesmo individuo ou replica nao sao estatisticamente 
independentes entre si, devendo-se tomar cuidado para garantir que as analises 
reflitam essa estrutura de dependencia nos dados. 

Dois tipos de delineamentos sao incluidos na analise de medidas repetidas. 
No primeiro, linica replica e exposta a diferentes tratamentos experimentais, cada 
um aplicado em tempos diferentes e em ordem aleatorizada. Por exemplo, plantas 
individuals podem ser expostas a uma serie de diferentes concentranoes de C0 2 . 
Em cada uma, as taxas fotossinteticas sao medidas (p. ex., Potvin et al., 1986). 
Esse delineamento tambem pode ser utilizado quando as replicas sao amostradas 
repetidas vezes, mas nenhuma manipulanao e aplicada. Neste caso, os tratamentos 
correspondem apenas aos efeitos do tempo. 

Para ambas as varianoes, o modelo e: 

Yjj = |1 + A • + Bj + 8- (10.13) 
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TABELA 10.7 Tabela de ANOVA para um delineamento fatorial com 3 fatores 


Fonte 

Graus de liberdade (gl) 

Soma dos quadrados (SQ) 

Fator A 

a- 1 

a b c n 

mi 

i=l j=l k= 1 /= 1 

Fator B 

b -1 

a b c n 

SZIKJJ-W 

f=l ;=1 £=1 /=1 

Fator C 

c-1 

a b c n 

llim-yf 

/=1 7=1 *=1 /=1 

Intera^ao Ax B 

1 

1 

a £ c n 

1=1 7=1 /:=1 /=1 

Intera^ao A x C 

(a-l)(c-l) 

XIIX<ii->'-F t + F> 2 

i=l 7=1 *=1 /=1 

Intera^ao BxC 

(b-l)(c-l) 

tiitih-Tt-z+T? 

/=1 7=1 £=1 /=1 

Intera^ao Ax BxC 

(fl-l)(6-l)(c-l) 

> 

" b c n (Y-L-Y--Y-L-Y-L+) 2 

Y* y V V y* v *k jk 

ZjZjZjZj y ,y ,y_y 

i=l 7=1 fc=l /=1 y * i ' * j ' * J 

Dentro de grupos 
(residuo) 

abc{n - 1) 

titiow-JU) 2 

i=l 7=1 *=1 /=1 

Total 

abctt -1 

a b c n 

1=1 7=1 *=1 /=1 


Ha de i = 1 ate a niveis do Fator A, de; = 1 ate b niveis do Fator B, de k = 1 ate c niveis do Fator C e n replicas 
de cada combina^ao unica de tratamento ijk. Os fatores A, B e C sao fixos. Este modelo gera tres efeitos 
principals (A, B> C), tres termos de intera<;ao par a par (A£, AC, BC) e um termo de intera^ao com tres fa¬ 
tores (ABC). Como os Fatores A, B e C sao todos fixos, todos os efeitos principals e termos de intera<;ao sao 
testados contra o quadrado medio do residuo. Com o intuito de analisar esse tipo de delineamento, todas 
as possiveis combina^oes de tratamentos dos diferentes fatores devem ser estabelecidas com replica^ao para 
cada uma delas. 
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Quadrado medio (QAf) 

Quadrado medio 
esperado 

Razao-F 

Valor de P 

sq a 

cr + bcna 2 A 

sq a 

Cauda da distribui^ao 

F com (a - 1 ),ab(n- 1) 
graus de liberdade 

(a- 1) 

SQdentro de grupos 

SQb 

2 2 

SQ b 

Cauda da distribui^ao 

F com (b - 1 ),ab(n- 1) 
graus de liberdade 

(b- 1) 

o' + acno~ B 

SO 

^ dentro de grupos 

SQ C 

a 2 + abnc 2 c 

SQ C 

Cauda da distribui^ao F 
com (c- 1 )>abc(n- 1) 
graus de liberdade 

(c-1) 

SQdentro de grupos 

SQab 

2 . 2 

SQab 

Cauda da distribui<;ao 

F com (a - 1) (b- 1), 
abc(n - 1) graus de li¬ 
berdade 


G “1“ 

so 

^ dentro de grupos 

SQac 

G 2 + bno 2 AC 

SQac 

Cauda da distribui^ao 

F com (a - 1) (c- 1), 
abc{n- 1) graus de li¬ 
berdade 

(a - l)(c - 1) 

SQdentro de grupos 

SQbC 

2 , 2 

SQ BC 

Cauda da distribui^ao 

F com (b- 1) (c-1), 
abc(n - 1) graus de li¬ 
berdade 

(b-\)(c-l) 

G “h ClllG 

so 

^ dentro de grupos 

SQabc 

_2 , 2 

SQaBC 

Cauda da distribui^ao 

F com (a - 1) (b - l)(c 
- 1 ),abc{n- 1) graus de 
liberdade 

(a — \){b — l)(c — 1) 

o + no ABC 

SQdentro de grupos 

SQdentro de grupos 

n 2 



abc(n-l) 

o 



SQtotal 

(i abcn — 1) 





onde ha de i = 1 ate a tratamentos (ou tempos) e de; = 1 ate n replicas (ou indivi- 
duos). Se voce comparar as Equates 10.13 e 10.8, vera que o modelo de medidas 
repetidas (e a tabela de ANOVA correspondente) e o mesmo que utilizamos para 
um delineamento de blocos aleatorizados (Tabela 10.4). Cada individuo serve como 
seu proprio bloco e os graus de liberdade do erro sao ajustados de maneira adequa- 
da. Como no delineamento de blocos aleatorizados, esta analise assume que nao ha 
intera^ao entre replicas (individuos) e tratamentos - apenas diferen^as aditivas sim- 
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TABELA 10.8 Tabela de ANOVA para delineamento de parcelas subdivididas 


Fonte 

Graus de 
liberdade (gl) 

Soma dos quadrados (SQ) 

Quadrado 
medio (QM) 

Fator A 
(tratamento 
parcela completa) 

a- 1 

a b c 

’L'L'Lw-y) 1 

1=1 ;=1 k= 1 

sq a 

(a- 1) 

Fator B(A) 

(parcelas aninhadas 
dentro de A) 

a(b- 1) 

abc 

i= 1 /=1 *=1 

(^-1) 

Fator C 

(tratamento dentro 
das parcelas) 

(c- 1) 

a b c 

i= 1 7=1 k= 1 

SQ C 

(c-1) 

Intera^ao Ax C 

(fl-l)(c-l) 

ZZZ<4-i;-ii+n 2 

i= 1 ;=1 k= 1 

SQaC 


(a — \)(c — \) 

Intera<;ao 

1 

1 

i= 1 7=1 

SQ BC 

B(A) x C 

1 

rT 

1 

Total 

abc- 1 

abc 

IIK^-n 2 

1=1 j=\ k= 1 

SQtotal 


(abc- 1) 


Ha de i = 1 ate a niveis do Fator A (aplicado as parcelas inteiras), de; = 1 ate b parcelas aninhadas dentro 
do Fator A e de k = 1 ate c niveis do Fator C (aplicado dentro das parcelas). Os Fatores A e C sao fixos, o 
Fator B (parcelas) e aleatorio. Neste delineamento, a razao-F para o fator A utiliza o fator parcela (£, ani- 
nhado dentro de A) como o termo de erro para o denominador da razao-F, pois sao as parcelas que sao as 
replicas independentes para o Fator A. O teste da razao-F para o Fator C (o fator dentro da parcela) e para 
a intera^ao Ax C utilizam a intera^ao B (parcela) x C como denominador. Este modelo assume que nao 
ha intera<;ao entre parcelas e o Fator A, porque essa intera^ao nao pode ser estimada no delineamento de 
parcelas subdivididas. 


pies entre individuos em suas respostas aos tratamentos. Alem disso, os tratamentos 
precisam ser aplicados em ordem aleatoria e deve ter passado tempo suficiente entre 
as aplica<;oes dos tratamentos para garantir que as respostas sejam independentes. 
Temos de assumir que nao ha efeitos carregados de um tratamento para o proximo, 
como a acumula^ao de nutrientes, altera^ao de habitat, adapta^ao fisiologica ou (em 
estudos comportamentais) habitua<;ao ou respostas aprendidas. Note, tambem, que 
a ordem do tratamento e confundida com o tempo: como os tratamentos nao sao 
aplicados simultaneamente, um individuo recebe certos tratamentos no inicio do 
periodo experimental e outros em periodos posteriores. Esta e outra razao do porque 
e essencial aleatorizar a ordem de aplica^ao dos tratamentos. 

No segundo tipo de delineamento de medidas repetidas, diferentes tratamen¬ 
tos sao aplicados, porem cada replica (ou individuo) recebe um unico tratamento, 
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Quadrado medio esperado 

Razao-F 

Valor de P 

r + c<j 2 b + bc<5 2 A 

qm a 

qm b 

Cauda da distribui^ao F com (a - 
1), a(b- 1) graus de liberdade 

2 2 

S+COj, 



r + a~ BC + ba(5~ c 

QM C 

QMb(A)xC 

Cauda da distribui^ao F com (c- 1), 
a(b- l)(c— 1) graus de liberdade 

r+a 2 BC + bc 2 AC 

QMac 

QMb(A)xC 

Cauda da distribui^ao F com (a - 1) 
(c- 1 ),a(b- l)(c— 1) graus de liber¬ 
dade 


_2 , _2 


que depois e medida em tempos diferentes. Voce pode pensar nesse delineamento 
como uma extensao da ANOVA de um fator, em vez de fazer uma unica observa- 
^ao por replica, aplicamos o tratamento e fazemos observances multiplas em cada 
replica em diferentes tempos. O modelo e: 

Y ijk = 4 + A i + B j( i) + C k + AC ik + CB kj(i) (10.14) 

Neste modelo, ha de i = 1 ate a tratamentos, de j = 1 ate b replicas (ou indivi- 
duos) aninhados dentro dos tratamentos e de c - 1 ate k vezes (tempos). Se voce 
comparar a Equa^ao 10.14 com a 10.12 vera que esse modelo de medidas repeti- 
das e estruturalmente equivalente ao de parcelas subdivididas. No delineamento 
de medidas repetidas, cada replica (ou individuo) e equivalente a uma parcela 
inteira. O fator de parcela completa e simplesmente o tratamento que foi aplicado 
no delineamento de um fator. O fator dentro da parcela e o tempo, com cada pe- 
riodo amostral equivalente a um nfvel de tratamento diferente. Na terminologia 
do delineamento de medidas repetidas, o efeito do tratamento da parcela com¬ 
pleta corresponde ao entre temas, e os efeitos do tratamento dentro das parcelas 
correspondem ao existente dentro de temas. 
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Como no delineamento de parcelas subdivididas, temos de assumir que 
nao ha intera^ao entre tempo e replica: em outras palavras, o perfil da ten- 
dencia temporal da resposta e o mesmo para todas as replicas dentro de um 
dado tratamento. Como cada individuo e, por defini^ao, unico, nao ha ne- 
nhuma amostragem adicional que podemos realizar para estimar esse termo 
de intera<;ao. Uma ultima variante do delineamento de medidas repetidas e 
aquela na qual as medidas de “tempo” sao feitas antes e depois da aplica^ao do 
tratamento. Nesse caso, temos a forma de um delineamento ADCI (Antes-De- 
pois-Controle-Impacto), com medidas antes e depois em parcelas de controle 
e de impacto (ver Capitulo 7). 

Como notamos no Capitulo 7, todos esses delineamentos assumem circu- 
laridade estatistica - a variancia da diferen<;a entre quaisquer pares de tempo e 
a mesma. Tal pressuposto raras vezes e cumprido com dados de series tempo- 
rais e outros tipos de analises podem ser mais apropriadas para incorporar a 
varia«;ao temporal. 3 * 5 Como na analise de parcelas subdivididas, voce deve evitar 
o erro comum de encarar esses dados como um delineamento apenas de dois 
fatores. As observances repetidas coletadas em uma unica replica nao sao es- 
tatisticamente independentes, portanto o quadrado medio da varia^ao entre 
replicas dentro de um tratamento e o denominador correto para usar no seu 
teste do efeito dos tratamentos. 


ANCOVA 

Agora que voce entende como usar a regressao linear para variaveis continuas (Ca¬ 
pitulo 9), podemos desenvolver um novo modelo, hibrido de regressao e analise 
de variancia. A ANCOVA (analise de covariancia) e utilizada para delineamentos 
de ANOVA, na qual uma variavel continua adicional (a covariavel) e medida para 
cada replica. A hipotese e de que a covariavel tambem contribui para a altera^ao 
na variavel resposta. Se a covariavel nao tiver sido medida, aquela fonte de varia- 
nao acumularia como erro puro no residuo. Na analise de covariancia, podemos 
remover estatisticamente essa fonte de varia^ao dos residuos. Se a covariavel tiver 
um efeito importante, o tamanho do residuo e muito menor e nosso teste para as 
diferennas dos tratamentos sera muito mais poderoso. Uma forma util de pensar 
sobre a ANCOVA e que ela e uma analise de variancia realizada com os residuos 
de uma regressao da variavel resposta pela covariavel. 

Retornando ao exemplo das cracas do Capitulo 7, sabemos que o seu esta- 
belecimento e diferente em superficies horizontais versus verticais e suspeitamos 
que a varia^ao no angulo em que colocamos cada replica pode contribuir para 


3 Discutimos as analises univariadas para dados de medidas repetidas. Uma estrategia diferente e 

analisar os dados de medidas repetidas como de variancia multivariada (MANOVA; ver Capitulo 
12), na qual o vetor resposta e um conjunto de medidas repetidas para cada replica. A MANOVA 

possui pressupostos diferentes daqueles das analises univariadas e ela pode ser menos poderosa e 
requerer mais replica^ao. Ver Gurevitch & Chester (1986) e Potvin et al. (1990) para uma discussao 
adicional. 
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o padrao em nossos dados. E claro que tentariamos colocar nossos tratamentos 
de substratos em uma orienta^ao aproximadamente horizontal, mas e provavel 
que haja varia^ao de uma replica para a outra. Por isso, para cada uma, medimos 
o angulo de orienta^ao em uma escala continua que vai de 0 ate 90 graus. 6 Essa 
variavel continua sera utilizada como covariavel nas analises. 

O modelo e: 


Yy - |i + A, + (3, (Xjj — Xj) + £jj (10.15) 

onde A,- e o efeito do tratamento (de i = 1 ate a tratamentos), X {) e a covariavel 
medida para a observa^ao Y iP X i e o valor medio da covariavel para o grupo de 
tratamento i e £, ( e (como de costume) o termo de erro. Note que este modelo 
contem um termo A, para o efeito do tratamento (como na ANOVA) e um ter¬ 
mo de inclina^ao (3, para o efeito da covariavel (como na regressao). A Equa^ao 
10.15 representa o caso mais complexo. Isso implica que cada grupo de trata¬ 
mento e descrito por sua propria linha de regressao, cada uma com inclina^ao e 
intercepto distintos. 

Um numero de modelos simples esta incorporado na Equa^ao 10.15. Por 
exemplo, suponha que todos os grupos de tratamentos tenham uma inclina^ao de 
regressao em comum. Neste caso, podemos utilizar o mesmo termo de inclina^o 
(P c ) para cada grupo de tratamento ((3,): 

Yy = p + A,- + |3 C (X tj -X,) + Ejj (10.16) 


Se os termos de inclina^ao representando o efeito da covariavel nao diferirem 
de zero, o modelo reduz a: 

Yq = P + A, + £y 

que e apenas uma ANOVA de um fator (Equa^ao 10.6). 

Inversamente, se nao ha efeito do tratamento e se nao houver intera<;ao 
entre o tratamento e a covariavel, o modelo reduz a uma regressao linear pela 
covariavel: 


6 Seja cuidadoso quando utilizar dados angulares de qualquer tipo. O exemplo das cracas que 
descrevemos aqui pode ser analisado com estatisticas convencionais, mas se os dados angulares 
forem medidos em uma escala circular completa, havera problema. Por exemplo, em um estudo 
de atividade de formigas, suponha que medimos a atividade de forrageamento diaria em uma 
escala de 0 a 24 horas. Se o pico de atividade e a meia-noite, poderlamos ter registrado duas obser¬ 
vances de forrageamento as 23h (= 11:00 pm) e a lh (= 1:00 am). Mas se voce tirar a media desses 
dois numeros, a media sera meio-dia (12h) e nao meia-noite (Oh)! Como a escala dessas medidas 
e circular, em vez de linear, nao podemos utilizar as formulas-padrao para calcular nem mesmo 
medidas basicas, como medias e variancias. Um conjunto inteiro de procedimentos diferentes e 
necessario para essas estatisticas circulares. Ver Fischer (1993) para uma introdu^ao a estatisticas 
circulares em biologia. 




334 Nicholas J. Gotelli e Aaron M. Ellison 


Y ij =[L + $ T (X ij -X) + e ij (10.17) 

A inclina^ao neste modelo (p T ) e ajustada para todos os dados e as atribui^oes 
de tratamentos sao ignoradas. 

A analise de covariancia geralmente envolve primeiro um teste das diferen^as 
entre os (3,. Esse teste pergunta se as inclina^oes sao heterogeneas para o grupo 
como um todo. Se positivo, o efeito do tratamento depende do valor da covariavel 
(a variavel X) e utilizamos o modelo completo para as analises (Equa^ao 10.15). 
Em casos extremos, se as linhas das regressoes se cruzarem, a ordem dos valores 
esperados para cada tratamento ira diferir entre valores pequenos e grandes da 
covariavel. Essa “intera^ao” e similar a um termo de intera^ao entre duas variaveis 
categoricas em uma ANOVA fatorial: as diferen<;as entre as medias dos tratamen¬ 
tos do Fator A dependem do nivel do Fator B (e vice-versa). 

Se o teste da heterogeneidade das inclina«;6es nao for significativo, uma in- 
clina^iao em comum P c pode ser ajustada para todos os tratamentos (Equa^ao 
10.16) e as medias ajustadas podem ser calculadas. A media ajustada e o valor es- 
perado do grupo de tratamento que seria encontrado se todos os grupos tiverem 
o mesmo escore medio da covariavel: 

Yji = (J, + A ( - + Pc X (10.18) 

Idealmente, em uma analise de covariancia, a medida da covariavel para 
os diferentes grupos de tratamentos abrangera a mesma amplitude de valores 
e nao ira diferir em suas medias (Figura 10.1A). Neste caso, a ANCOVA faz 
sentido porque os dados nos grupos de tratamentos sao comparados a mesma 
amplitude de valores da covariavel. Essa distribu^ao dos escores da covariavel 
e exatamente o que esperariamos se metodos de aleatoriza^ao apropriados fos- 
sem utilizados para determinar o arranjo espacial das replicas e as atribui^oes 
dos tratamentos. Mas suponha que no experimento das cracas voce coloque 
inadvertidamente o substrato de cimento em uma area costeira plana, o de gra- 
nito em uma area ingreme e o de ardosia em uma area com inclina^ao inter¬ 
mediary (Figura 10.IB). Agora, a ANCOVA esta em terreno movedi^o, pois os 
tratamentos estao confundidos com as diferen^as na covariavel. Com rela^ao 
as estatisticas, ainda podemos proceder com a ANCOVA, mas teremos que ex- 
trapolar a linha da regressao para alem da amplitude dos dados de cada trata¬ 
mento e assumir (bem como ter esperanqa) que a mesma rela^ao linear ainda 
se mantenha. Se a linearidade se mantem, a ANCOVA ira estatisticamente fazer 
a parti^ao da variancia, que e associada a covariavel. Porem, ela nao ira reme- 
diar o fato de que o delineamento esta inerentemente confundido. Como temos 
enfatizado ao longo desse texto, a aleatoriza^ao e a melhor prote^ao contra sur- 
presas como a da Figura 10.IB. 
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Figura 10.1 Conjunto de dados seguros e arriscados para uma analise de covariancia. A co¬ 
variavel e apresentada no eixo-x e a variavel resposta no eixo-y. As tres cores representam tres 
grupos de tratamentos. Cada ponto e uma replica independente. (A) Neste caso, as medidas da 
covariavel ocorrem na mesma amplitude para cada grupo de tratamento. As compara^oes da 
ANCOVA sao seguras, porque as relates de regressao nao precisam ser extrapoladas. (B) Neste 
caso, as medidas da covariavel para cada um dos tres grupos de tratamentos nao se sobrepoem. 
0 delineamento esta essencialmente confundido, pois o tratamento verde esta associado so- 
mente aos valores pequenos da covariavel e os tratamentos pretos somente aos valores grandes. 
A analise assume que as relates de regressao permanecem lineares quando elas sao extrapo¬ 
ladas para alem da amplitude observada dos dados (indicado pelas linhas de regressao traceja- 
das). A analise estati'stica e a mesma em ambos os casos, porem as conclusoes sao muito menos 
confiaveis para os dados em (B). 


FATORES ALEATORIOS VERSUS FATORES FIXOS EM ANOVA 

Os testes que apresentamos ate agora sao os tipos de resultados que voce obteria 
em uma analise padrao com qualquer programa de computador. Infelizmente, 
para delineamentos com dois fatores ou mais complicados, essas analises podem 
nao ser corretas. 

Um ponto importante que surge em delineamentos multifatoriais e quando 
cada fator deve ser analisado como um fator fixo ou como um fator aleatorio. 
No primeiro caso, os diferentes niveis de tratamento utilizados sao os unicos de 
interesse, e as inferencias serao restritas aqueles niveis em particular. No segun- 
do, os niveis de tratamento em particular representam uma amostra aleatoria 
de todos os niveis possiveis que podem ter sido estabelecidos; pretende-se que 
as inferencias sejam validas nao apenas para os niveis de tratamento testados, 
mas para outros que nao foram incluidos no delineamento. Em uma analise de 
modelo misto, alguns dos fatores sao fixos e outros sao aleatorios. O resultado 
padrao em quase todos os programas estatisticos e para uma ANOVA com fa¬ 
tores fixos. 

Por que essa distin^ao entre fatores fixos e aleatorios e importante? A razao e 
que os valores dos quadrados medios esperados sao diferentes em ANOVAs com 
fatores fixos ou aleatorios. Consequentemente, as razoes-F utilizadas para testar 
hipoteses acerca de fatores aleatorios e fixos serao diferentes. Por exemplo, em 
uma ANOVA com dois fatores fixos, tanto os efeitos principais quanto os termos 
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de intera^ao sao testados contra o quadrado medio dos residuos (Tabela 10.6). 
Mas em um modelo de efeitos aleatorios, os efeitos principals sao testados utili- 
zando o quadrado medio da interaqao no denominador da razao-F e nao o qua¬ 
drado medio dos residuos. Tanto os quadrados medios quanto os graus de liber- 
dade sao muito diferentes para esses dois termos, o que significa que seus valores 
de significance mudarao completamente. Em um modelo misto, o Fator A e fixo 
e o Fator B e aleatorio. Neste caso, o Fator A e testado contra o quadrado me¬ 
dio da intera^ao, mas o Fator B e testado contra o quadrado medio dos residuos. 
As Tabelas 10.9 e 10.10 fornecem os quadrados medios esperados e as razoes-F 
apropriadas tanto para modelos de efeitos aleatorios quanto para modelos mistos 
para uma ANOVA de dois fatores. Note que ANOVAs de fatores fixos, de fatores 
aleatorios e de modelos mistos se aplicam apenas para modelos com dois ou mais 
fatores. ANOVAs de um fator sao calculadas da mesma forma, independente se o 
fator do tratamento e fixo ou aleatorio. 

O calculo correto das razoes-F em ANOVAs de modelos com fatores aleato¬ 
rios ou mistos e muito importante, mas tao importante quanto e o fato de que 
esses diferentes modelos prescrevem diferentes estrategias amostrais. Nos de 
efeitos fixos, nosso objetivo deve ser o de replicar o maximo que conseguirmos 
para cada combinaqao de tratamentos. Todas as replicas extras nos darao mais 


TABELA 10.9 Tabela de ANOVA para uma ANOVA de dois fatores com efeitos 
aleatorios 


Fonte 

Graus de liberdade (gl) 

Soma dos quadrados (SQ) 

Quadrado medio (QM) 

Fator A 

a - 1 

a b n 

SZS (f i - F > 2 

1=1 ;=1 k= 1 

sq a 

(fl-1) 

Fator B 

b- 1 

abn 

IEI oV F > ! 

1=1 7=1 k= 1 

SQ B 
(b- 1) 

Intera^ao 


i= 1 7=1 k= 1 

SQab 

(AxB) 

(a-l)(b-l) 

Dentro de 

grupos 

(residuos) 

ab(n -1) 

abn 

III<%-v 2 

1=1 ;=1 k=l 

S Q<ientro de grupos 

ab(n- 1) 

Total 

abn- 1 

abn 

III<v - F » 2 

i= 1 7=1 k=\ 

SQtotal 

(abn- 1) 


Ha de i = 1 ate a niveis do Fator A, de; = 1 ate b niveis do Fator B e« replicas para cada combina^ao unica 
de tratamentos ij. A razao-F para ambos os efeitos principals e testada utilizando o quadrado medio da 
intera<;ao no denominador. Em contraste, o quadrado medio dos residuos e utilizado no denominador da 
razao-F padrao (Tabela 10.6), na qual ambos os tratamentos sao fatores fixos. 
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graus de liberdade para o quadrado medio dos residuos, o que ira aumentar 
nosso poder estatistico. Mas, para modelos de efeitos aleatorios ou mistos, de- 
vemos utilizar uma estrategia diferente. Em vez de tentar aumentar a replica<;ao 
dentro de cada nivel de tratamento, deviamos procurar aumentar o numero 
de niveis de tratamento que estabelecemos e nao nos preocupar muito com a 
replica<;ao dentro de cada nivel. O numero de niveis de tratamento determina 
o numero de graus de liberdade do quadrado medio da intera^ao, e e onde 
queremos aumentar a amostragem. No pior cenario, se rodarmos uma ANOVA 
de dois fatores aleatorios com apenas dois niveis de tratamento para cada fator, 
teremos apenas 1 grau de liberdade para a soma dos quadrados da intera^ao 
- nao importa quanta replica<;ao tenhamos usado ( ver Nota de rodape 10, Ca- 
pitulo 7). 

O esfor^o amostral apropriado para um modelo de efeitos fixos versus um de 
efeitos aleatorios deveria fazer algum sentido intuitivo. Se o dominio de inferencia 
e restrito aos tratamentos estabelecidos, entao uma replica«;ao extra aumentara 
nosso poder no modelo de efeitos fixos. Mas se os niveis de tratamento sao apenas 
subconjuntos aleatorios de muitos niveis de tratamento possiveis, devemos tentar 
aumentar a cobertura dos diferentes niveis para o modelo de efeitos aleatorios. 
Se os niveis de tratamento representam uma variavel continua que foi convertida 


Quadrado medio esperado 

Razao-F 

Valor de P 

< 

qm a 

Cauda da distribui^ao F com (a - 

a 2 + na 2 AB + nba 2 A 

Qm ab 

1 ), (a - l)(b- 1) graus de liberdade 

+ na(5~ B 

qm b 

QMab 

Cauda da distribui^ao F com ( b - 
l)(b- l) graus de liberdade 

a 2 +no 2 AB 

QM AB 

QM dentro de grupos 

Cauda da distribui^ao F com (a - 1 ) 

(b - 1 ),ab(n- 1) graus de liberdade 


o 


2 

Y 
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em um fator discreto para a ANOVA, a melhor estrategia pode ser abandonar por 
completo os delineamentos de ANOVA e tratar o problema como um delinea- 
mento experimental de regressao ou de superficie de resposta, conforme discuti- 
mos no Capitulo 7. 

Nem sempre e facil decidir se um fator deve ser analisado como fixo ou 
aleatorio. Se trata de um conjunto de locais ou de tempos escolhidos de ma- 
neira aleatoria, quase sempre deve ser tratado como um fator aleatorio, que e 
como os blocos sao analisados em um delineamento de blocos aleatorizados ou 
em um delineamento de medidas repetidas. Se ele representa um conjunto de 
categorias bem-definidas que sao limitadas em numero e nao representa uma 
varia^ao continua, como especies ou sexos, esse fator provavelmente deve ser 
tratado como do tipo fixo. 

Uma abordagem e considerar a razao x/X, onde x e o numero de tratamentos 
no estudo eXeo numero de niveis de tratamento possiveis. Se esta razao der 
proximo de 0, voce provavelmente tern um fator aleatorio; se der proximo de 1,0, 
voce provavelmente tern um fator fixo. 

Muitas variaveis naturalmente continuas, como a concentra<;ao de nutrientes 
ou densidade populacional, deveriam ser analisadas como fatores aleatorios se voce 
estabelecer niveis discretos para o seu delineamento de ANOVA. Entretanto, se ha 


TABELA 10.10 Tabela de ANOVA para um modelo misto de dois fatores 


Fonte 

Graus de 
liberdade (gl) 

Soma dos quadrados (SQ) 

Quadrado 
medio (QM) 

Fator A 

a -1 

abn 

1=1 y=l*=l 

SQ, 

(c/-l) 

Fator B 

6-1 

abn 

i= 1 j=lk=\ 


(6-1) 

Intera^ao 

1 

1 

i= 1 j=\k= 1 

SQab 

(AxB) 

1 

1 

Dentro de 

grupos 

(residuos) 

ab(n-l) 

i=l j= 1 *=1 

SQ dentro de grupos 

ab(n — 1) 

Total 

abn- 1 

a b n 

IIIo*-* 7 ) 2 

1=1 7=1 k= 1 

SQtotal 

{abn — 1) 


O Fator A e fixo e o Be aleatorio. Ha de i = 1 ate a niveis do Fator A, de ; = 1 ate b niveis do Fator Ben 
replicas de cada combina^ao de tratamentos unica ij. Note que a razao-F para o Fator A utiliza o quadrado 
medio da interat^ao no denominador, mas a razao-F para o Fator B e para o efeito de intera^ao (A x B) 
utilizam o quadrado medio dos residuos no denominador. Os graus de liberdade para esses dois efeitos 
tambem sao diferentes. 
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uma significance especial para os niveis de tratamento em particular que voce uti- 
lizou, pode ser melhor utilizar um delineamento fixo. Por exemplo, em um estudo 
de densidade, voce pode estabelecer apenas dois tratamentos: densidade ambiental 
e densidade zero. Embora haja muitos outros niveis possiveis, o primeiro pode ser 
visto como condi^oes em equilibrio, enquanto a ausencia da especie representa uma 
condi^ao de pre-invasao. Um delineamento fixo poderia ser apropriado neste caso. 

Voce deve deixar claro na se^ao dos metodos do seu artigo ou relatorio quais 
fatores foram fixos e/ou aleatorios e utilizar o delineamento apropriado para a 
sua ANOVA. Nao ha desculpa para confiar nas analises de fatores fixos padrao, 
especialmente quando a maioria dos programas estatisticos permite que voce 
especifique quais termos de erro serao utilizados. As Tabelas 10.9 e 10.10 ilus- 
tram o quadrado medio esperado apropriado apenas para o modelo de ANOVA 
de dois fatores. Para um delineamento mais complexo, os quadrados medios 
esperados para efeitos mistos e aleatorios podem ser encontrados em outros 
textos sobre ANOVA (p. ex., Winer et al., 1991). Entretanto, em alguns deline- 
amentos complexos pode nao ser possivel construir razoes-F validas para mo- 
delos mistos. Essa e outra razao para usar delineamentos de ANOVA simples e 
evitar delineamentos que utilizam muitos fatores com aninhamento ou medidas 
repetidas em suas analises. 


Quadrado medio esperado Razao-F 


Valor de P 


cr +nc 2 AB + nbo\ 


9Ma 

QM, 


AB 


Cauda da distribute) F 
com (a-l),(a-l)(b-l) 
graus de liberdade 


o + nci(5~fi 


QMi 


QM 


cientro degrupos 


Cauda da distribui^ao F 
com (b - 1 )>ab(n- 1) graus 
de liberdade 


a 1 +na 2 AB 


QM 


AB 


QM 


dentro de grupos 


Cauda da distribui^ao F 
com (a - 1 )(b- 1 ),ab{n- 
1) graus de liberdade 


a 


2 


a 


2 

Y 
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PARTPO DE VARIANCIA NA ANOVA 

Muitos usos da ANOVA em ecologia e ciencias ambientais tern o objetivo de tes- 
tar hipoteses sobre os efeitos principais e termos de intera«;ao. Entretanto, como 
destacamos no Capitulo 4, testar hipoteses e apenas o primeiro passo ao analisar 
dados. Tambem estamos interessados em estimar parametros de modelos ou em 
determinar qual varia^ao nos dados pode ser atribuida a uma fonte em particular 
(Figura 4.6). A no^ao de parti^ao de variancia e familiar da analise de regressao 
(Capitulo 9), na qual o valor do coeficiente de determina^ao (r 2 ) pode ser mais 
importante que o fato de a hipotese nula ser rejeitada ou nao. 

Podemos fazer a part^ao da variancia na ANOVA de maneira semelhante, 
mas o procedimento nao e matematicamente tao simples quanto na regressao. 
No passado, os pesquisadores tentaram inferir, incorretamente, a importancia 
relativa de um fator em particular a partir do tamanho do quadrado medio ou 
do valor de P calculado. Ambas as abordagens estao erradas. O quadrado medio 
quase sempre estima mais de um componente de variancia, portanto ele nao 
pode ser utilizado sozinho. Alem disso, o valor de P sera sensivel ao tamanho 
amostral utilizado no estudo. 

A abordagem correta e come^ar com o quadrado medio esperado da sua ta- 
bela de ANOVA em particular e depois transforma-lo algebricamente para isolar 
o componente de variancia de interesse. Por exemplo, em uma ANOVA com um 
fator fixo, sabemos que o quadrado medio dos residuos estima a varia^ao dentro 
de grupos: 


G 2 e = Q M dentrode grupos ( 10 . 19 ) 

O quadrado medio entre grupos estima o efeito do tratamento mais o re- 
siduo: 


a; + tig , 2 = QM 


entre grupos 


( 10 . 20 ) 


Se rearranjarmos a Equa^ao 10.20, podemos isolar o efeito do tratamento: 




entre grupos dentro de grupos 


( 10 . 21 ) 


Um refinamento adicional e necessario. Como essa e uma ANOVA de fator 
fixo, ha um numero finito de niveis de tratamento do Fator A. Portanto, a esti- 
mativa da variancia devido ao efeito do tratamento (que, a rigor, nao e uma “va¬ 
riancia” verdadeira) precisa ser ajustada pelo fator (a - 1 )/a. Esse ajuste leva em 
conta a diferen«;a nos graus de liberdade que temos para uma medida de variancia 
verdadeira (a) e uma estimativa de variancia a partir de um amostragem finita 
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(a - 1). Note que conforme o numero de grupos de tratamento aumenta, o fator 
de corre^ao [(a - 1 )la\ se aproxima de 1,0. Isso tem sentido intuitivo, porque um 
modelo de efeitos fixos com um grande numero de niveis de tratamento efetiva- 
mente e um modelo de efeitos aleatorios. 

Com esse pouco de contabilidade para os componentes de fatores fixos, temos: 



( QA/ en(rc grupos Q^^dentro de grupos )(^ 1) 

na 


( 10 . 22 ) 


Uma vez que os componentes de variancia tenham sido isolados dessa ma- 
neira, suas contributes para o total podem ser calculadas como a propor^ao de 
variancia explicada (PVE): 


PVE e = 


_2 . _2 

°A +<7 e 


(10.23) 


e 


PVE a = f A - (10.24) 

<* A +<*l 

Algebricamente, essa parti^ao equivale ao calculo do r 2 em uma regressao li¬ 
near (Capitulo 9). 

Como exemplo, usando os dados da Tabela 10.1, o QM entregrupos - 11,085, o 
Q M demodegrupos = 2,167, = 3 grupos, n = 4 replicas por grupo. A partir das Equa¬ 

tes 10.21 e 10.22, a estimativa da variancia para o efeito do tratamento e 1,486 
e a estimativa da variancia para o residuo e 2,167. Pela Equa^ao 10.23, a PVE A - 
41%: (l,486)/( 1,486 + 2,167) = 0,406. 

Para ANOVAs de dois fatores, seguimos o mesmo prindpio de isolar al¬ 
gebricamente o termo de interesse, embora os calculos sejam um pouco mais 
complexos. Como voce pode imaginar, os calculos na ANOVA de dois fatores 
dependem de se estamos utilizando modelos de efeitos fixos, aleatorios ou mis- 
tos (Tabela 10.11). 

Mesmo com os calculos corretos, a tecnica ainda tem algumas limita^oes im- 
portantes. Talvez o problema conceitual mais serio e que a parti^ao se aplica ape- 
nas aos fatores que foram realmente medidos e incluidos no modelo. Qualquer 
varia^ao em fatores nao medidos, independente de sua importancia, e inserida 
no quadrado medio do residuo ou nos efeitos do tratamento medido (se houver 
intera^oes entre os fatores medidos e os nao medidos). 

Mesmo em uma ANOVA de um fator, a quantidade de varia<;ao atribuivel ao 
efeito do tratamento versus ao residuo ou erro dependera nao apenas do numero 
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TABELA 10.11 Componentes de variancia em modelos de ANOVA de dois fa to res 
com fatores fixos, aleatorios ou mistos 


Componente 
de variancia 

Modelo de efeitos fixos ( A fixo, B fixo) 

Modelo de efeitos aleatorios 
(A aleatorio, B aleatorio) 

A 

(QM A -QM res(duo )(a- 1) 

(QM A -QM AxB ) 

abn 

bn 

B 


(< qm b -qm AxB ) 

abn 

an 

AxB 


(Q M AxB -QMresiduo) 

abn 

n 

Residuo 

QM residuo 

QM residuo 


de grupos de tratamentos utilizados, mas tambem dos niveis em particular que 
sao escolhidos (Underwood & Petraitis, 1993; Petraitis, 1998). Similarmente, em 
um estudo de regressao com uma variavel preditora continua, a quantidade de 
varia^o contabilizada dependera da amplitude dos valores de X escolhidos (Fi- 
guras 7.2 e 7.3). 

Esta limita^ao indica que e dificil, mas nao impossivel, comparar a intensida- 
de de formas relativas em diferentes estudos. 7 Entretanto, as mesmas ressalvas se 
aplicam na interpreta^ao dos valores de P calculados na ANOVA. Quando calcu- 
lada corretamente e interpretada de forma conservativa, a parti^ao de variancia e 
um complemento util para o teste de hipoteses padrao da ANOVA. 

APOS A ANOVA: PL0TAND0 E ENTENDENDO OS TERMOS DE INTERA^AO 

Neste ponto, voce ja especificou sua questao cientifica (Capitulo 4), delineou e 
executou seu experimento (Capitulos 6 e 7), coletou e gerenciou seus dados (Ca- 


7 Uma abordagem completamente diferente para avaliar estudos de efeitos entre estudos e a me¬ 
ta-analise (Arnqvist & Wooster, 1995). Na meta-analise, cada estudo individual e tratado como uma 
replica independente para o teste de uma hipotese mais ampla (p. ex., cascatas troficas sao mais in- 
tensas em cadeias alimentares aquaticas versus terrestres; Shurin et al., 2002). A partir de estudos pu- 
blicados, a meta-analise extrai um tamanho do efeito, em geral comparando as medias do controle 
e dos grupos de tratamentos, padronizados pela variancia estimada. A meta-analise tern se tornado 
popular recentemente, porem controversa, na ecologia e evolu^ao. Quantificar o tamanho do efeito 
apropriadamente (Osenberg et al., 1999) e controlar os vieses das publica^oes (Jennions & Moller, 
2002) sao dois desafios atuais na meta-analise. Ver Gurevitch et al. (2001) para uma introdu^ao aos 
metodos. 
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Modelo de efeitos mistos (A fixo, B aleatorio) 


(QM A -QM AxB )(g- 1 ) 
bna 

an 


Aqui, o a e o numero de niveis de tratamento no Fa- 
tor A; b e o numero de niveis de tratamento no Fator 
B; n e o numero de replicas por tratamento (em um 
delineamento balanceado); QM indica um valor de 
quadrado medio em particular, que e usado a partir da 
tabela de ANOVA. Como o quadrado medio esperado 
e diferente em modelos de ANOVA com fatores fixos, 
aleatorios e mistos, a estimativa dos componentes de 
variancia difere para esses modelos. Uma vez que os 
componentes de variancia sao estimados, podem ser 
usados para medir a porcentagem de varia<;ao a ser 
atribuida para cada fator na analise. 


(Q M AxB Q M residuo) 

n 


residua 


pitulo 8) e os analisou com ANOVA, usando metodos frequentistas, de Monte 
Carlo ou bayesianos (Capitulo 5). 

O proximo passo critico e plotar os resultados das analises. £ impossivel in¬ 
terpretar estatistica ou biologicamente os resultados de uma ANOVA sem uma 
referenda cuidadosa aos graficos dos dados, e voce nunca deve publicar apenas 
uma tabela de ANOVA sem publicar, tambem, alguma medida do tamanho dos 
efeitos (p. ex., medias dos grupos e das variancias), ou em tabelas ou em graficos. 
Ja discutimos a analise de dados exploratoria (EDA) como forma de checar a pre¬ 
sent de dados discrepantes ou erros (Capitulo 8) e de examinar os padroes gerais 
nos seus dados. Aqui, enfatizamos graficos com qualidade de publica^ao que des- 
tacam os padroes das medias e variancias, e que permitem que voce interprete os 
resultados dos testes estatisticos usando a ANOVA. 

Plotando resultados de ANOVAs de um fator 

Vamos considerar o delineamento de um fator mais simples para um estudo ex¬ 
perimental generico: tres grupos tratamentos, constituidos por um conjunto de 
parcelas sem manipula<;ao (S) que nao sao alteradas de nenhuma forma, exceto 
pelo censo ou pelas medi^oes que sao realizadas; um conjunto de parcelas con- 
trole (C) que incorpora possiveis efeitos da manipula<;ao, mas que na realidade 
nao implementa o tratamento de interesse; e as parcelas de tratamento (T), que 
implementam o tratamento de interesse e (por necessidade) tambem incluem os 
efeitos da manipula^ao. 

Podemos plotar esses dados em simples grafico de barras. O eixo-y represen- 
ta a variavel resposta, plotada em suas unidades de medida. No eixo-x, ha um ro- 
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tulo para cada grupo de tratamento plotado (3, nesse caso). Para cada um, plote 
uma barra simples (ou um grafico de barras, box-and-whisker, ver os Capitulos 3 
e 8). A altura da barra representa a media do grupo de tratamento. Adicione uma 
linha vertical acima da barra para indicar o desvio-padrao ao redor da media. 
Idealmente, a media amostral e o desvio-padrao amostral deveriam basear-se 
em, no minimo, 10 observances em cada grupo (ver Capitulo 6, “A Regra dos 
10”). Para delineamentos mais complicados, voce pode utilizar sombreamento 
para indicar tratamentos que representem subgrupos importantes nos seus da¬ 
dos. Esses subgrupos podem ser comparados com contrastes a priori, discutidos 
a seguir, neste capitulo. 

Com esse grafico em maos, agora podemos interpretar nossos resultados da 
ANOVA. Se o teste da razao-F para diferen^as entre grupos nao for significati¬ 
ve, quer dizer que nao ha evidencia de que a popula^ao de medias seja diferente 
do que poderia ser esperado ao acaso, devido ao erro amostral aleatorio (Figura 
10.2A). A ressalva e que o nosso experimento ou delineamento seguiu os pressu- 
postos da ANOVA e que nosso tamanho amostral e suficientemente grande para 
ter um poder razoavel para detectar um efeito (ver Capitulo 4). Note que se a 
variancia dentro de grupos e grande e o tamanho amostral pequeno, as medias 
amostrais podem ser ligeiramente diferentes umas das outras, mesmo que a hipo- 
tese nula nao tenha sido rejeitada. Por isso e tao importante plotar os desvios-pa- 
drao junto com as medias amostrais e considerar, com cuidado, o tamanho amos¬ 
tral do experimento. 

E se o teste da razao-F para diferennas entre os grupos e significativo? Existem 
tres padroes gerais nas medias que levam a tres diferentes interpreta^oes. Primei- 
ro, suponha que a media das parcelas do tratamento seja elevada (ou reduzida) 
se comparada as medias das parcelas-controle e das sem manipula^o (T > C = S, 
Figura 10.2B). Esse resultado sugere que o tratamento tern um efeito significativo 
na variavel resposta e que os resultados nao representam um artefato do delinea¬ 
mento. Note que o efeito do tratamento poderia ter sido inferido erroneamente 
caso tivessemos (por equivoco) executado o experimento sem os controles e com- 
parado apenas os grupos de tratamento e os sem manipula^ao. Como alternativa, 
suponha que os grupos de tratamento e os controles tenham medias similares, 
mas elas sao mais elevadas que a das parcelas sem manipula«;ao (T = C > S; Figura 
10.2C). Esse padrao sugere que o efeito do tratamento nao e importante e que a 
diferen<;a entre as medias reflete o efeito da manipula^ao ou outro artefato da ma- 
nipula<;ao. Por fim, suponha que as tres medias diferem entre si, com a do grupo 
de tratamento sendo a maior e a do grupo sem manipula<;ao a menor (T > C > S; 
Figura 10.2D). Neste caso, ha evidencia de um efeito da manipula^ao, pois C > S. 
Contudo, o fato de T > C significa que o efeito do tratamento tambem e real e nao 
representa apenas artefatos da manipula^ao. Uma vez que tenha estabelecido o 
padrao em seus dados usando a ANOVA e os resultados graficos, o proximo passo 
e determinar se o padrao tende a suportar ou refutar as hipoteses cientificas em 
avalia^ao (Capitulo 4). Sempre tenha em mente a diferen<;a entre as significances 
estatistica e biological 
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Figura 10.2 Possfveis resultados de um experimento hipotetico com tres tratamentos e uma 
configuragao de ANOVA de um fator. Parcelas sem manipula^ao nao sao alteradas em nenhuma 
forma, exceto para os efeitos que ocorrem durante a amostragem. As parcelas-controle nao re- 
cebem o tratamento, mas podem receber um tratamento falso para imitar os efeitos da manipu¬ 
late. 0 grupo de tratamento possui a manipulato de interesse, mas potencialmente tambem 
inclui os efeitos de manipulate). A altura de cada barra representa a resposta media para cada 
grupo e as linhas verticais indicam um desvio-padrao ao redor da media. (A) 0 teste de ANOVA 
para os efeitos do tratamento nao e significativo e as diferen^as entre grupos na resposta media 
pode ser atribuida apenas ao erro. (B-D) 0 teste de ANOVA e sempre significativo, mas o padrao - 
e,portanto, a interpreta^ao - difere em cada caso. (B) A media do tratamento e elevada se compa- 
rada as medias das replicas controle e sem manipulate), indicando um efeito real do tratamento. 
(C) Tanto as medias dos grupos controle quanto as do tratamento sao elevadas em relate* as 
parcelas sem manipulate), indicando um efeito da manipulate), mas nao distinto do tratamen¬ 
to. (D) Ha evidencia de um efeito da manipulate), pois a media do grupo controle excede a das 
parcelas sem manipulate), embora o tratamento desejado (biologico) nao tenha sido aplicado. 
No entanto, para alem desse efeito de manipulate), parece haver o do tratamento, pois a media 
do grupo de tratamento e elevada em relate) a do grupo controle. Contrastes a priori ou compa- 
ra0es a posteriori podem ser utilizadas para apontar quais grupos sao distintamente diferentes 
uns dos outros. Nosso ponto, aqui, e que os resultados da ANOVA podem ser identicos, mas a 
interpretagao depende do padrao das medias dos grupos em particular. Os resultados da ANOVA 
nao podem ser interpretados corretamente sem um exame cuidadoso do padrao das medias e 
variances dos grupos de tratamento. 


Plotando resultados de ANOVAs de dois fatores 

Para plotar os resultados de ANOVAs de dois fatores, graficos de barras simples 
tambem podem ser utilizados, mas eles sao mais dificeis de interpretar grafica- 
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mente e nao mostram muito bem os efeitos principals e os de intera^ao. Sugeri- 
mos o seguinte protocolo para plotar as medias de uma ANOVA de dois fatores: 

1. Estabele<;a um grafico no qual o eixo-y seja a variavel resposta continua e o 
eixo-x, os diferentes niveis do primeiro fator do experimento. 

2. Use um simbolo ou uma cor diferente para cada nivel do tratamento ao re- 
presentar o segundo fator do experimento. Cada simbolo, colocado sobre o 
rotulo da categoria apropriada no eixo-x, representa a media de uma combi- 
na^ao de tratamentos em particular. Havera um total de a x b simbolos, onde 
a e o niimero de tratamentos do primeiro fator e b e o de tratamentos do 
segundo fator. 

3. Alinhe cada simbolo acima do rotulo do fator apropriado para estabelecer a 
combina^ao de tratamentos representada. 

4. Use uma linha (colorida) para conectar os simbolos atraves dos niveis do pri¬ 
meiro fator. 

5. Para plotar os desvios-padrao, use linhas verticals apontando para cima 
(para os niveis de tratamento superiores) e linhas verticais apontando para 
baixo (niveis de tratamento inferiores). Se a figura se tornar muito desor- 
ganizada, as barras de erro podem ser ilustradas apenas para algumas das 
series de dados. 


Figura 10.3 Possiveis resultados para um experimento hipotetico testando efeitos dos trata¬ 
mentos de substrato e de preda^ao sobre o recrutamento de cracas. Cada simbolo representa a 
media para diferentes combina^oes de tratamentos. Os tratamentos de preda^ao sao indicados 
pelo rotulo no eixo-x e os dos substratos sao indicados por cores diferentes (verde = cimento; 
cinza = ardosia; preto = granito). As barras verticais indicam o erro-padrao ou desvio-padrao (o 
que precisa ser apontado na legenda da figura). Cada painel representa um padrao associado a 
um resultado estatistico em particular. (A) Nem os efeitos dos tratamentos nem o da intera^ao 
sao significativos e as medias de todas as combina^oes de tratamentos sao estatisticamente in- 
distinguiveis. (B) 0 efeito da preda^ao e significativo, mas o do substrato e o da intera^ao nao 
sao. Neste grafico, as medias dos tratamentos sao maiores para a exclusao do predador e meno- 
res para a sua inclusao, com um padrao similar para todos os substratos. (C) 0 efeito do substrato 
e significativo, mas os do predador e da interagao nao. Nao ha diferen^as nas medias do trata¬ 
mento de predagao, mas o recrutamento e sempre maior nos substratos de granito e menor nos 
de cimento, independente do tratamento de preda^ao. (D) Tanto o efeito de preda^ao quanto do 
substrato sao significativos, mas o efeito de intera^ao nao e. As medias dependem tanto do tra¬ 
tamento de substrato quanto do de preda^ao, porem o efeito e estritamente aditivo e os perfis 
das medias sao paralelos ao longo dos substratos e dos tratamentos. (E) Efeito de intera^ao sig¬ 
nificativo. As medias dos tratamentos diferem de maneira significativa, mas ja nao ha um efeito 
aditivo simples da predagao ou do substrato. 0 ranking das medias dos substratos depende do 
tratamento de predagao, e o ranking das medias de preda^ao, do substrato. Os efeitos principals 
podem nao ser significativos nesse caso, porque as medias dos tratamentos de substrato ou 
de preda^ao nao necessariamente diferem de maneira significativa. (F) 0 efeito da intera^ao 
e marcante, o que significa que o efeito do tratamento de predagao depende do tratamento 
de substrato e vice-versa. Apesar dessa intera^ao, ainda e possivel falar sobre os efeitos gerais 
do substrato sobre o recrutamento. Independente do tratamento de preda^ao, o recrutamento 
sempre e maior em substratos de granito e menor nos de cimento. 0 efeito da intera^ao e esta¬ 
tisticamente significativo, mas os perfis das medias, na verdade, nao se cruzam. w 



Numero de cracas recrutadas Numero de cracas recrutadas Numero de cracas recrutadas 
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A Figura 10.3 mostra exatamente esse tipo de grafico para o ex- 
perimento hipotetico de dois fatores das cracas que descrevemos. O 
eixo-x da os quatro niveis do tratamento de preda^ao (sem manipu- 
la^ao, controle, exclusao do predador e inclusao do predador). Tres 
cores (verde, cinza e preto) sao usadas para indicar os tres niveis do 
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tratamento de substrato (cimento, ardosia e granito). Para cada tipo de subs¬ 
trate), as medias dos quatro niveis do tratamento de preda^ao sao conectadas 
por uma linha. 

Mais uma vez, devemos considerar os diferentes resultados da ANOVA e o 
que os graficos associados poderiam parecer. Neste caso, existem varias possi- 
bilidades, pois agora temos dois testes de hipoteses para os efeitos principals da 
preda<;ao e do substrato, e um terceiro teste de hipoteses para a intera<;ao entre 
os dois. 

Nenhum efeito significativo Como antes, o cenario mais simples e aquele no 
qual nenhum dos dois efeitos principais nem o termo de intera^ao sao estatistica- 
mente significativos. Se os tamanhos amostrais forem razoavelmente grandes, este 
tambem sera o caso mais confuso para plotar, pois todas as medias dos grupos 
de tratamento serao muito similares entre si e os pontos das medias podem ficar 
bastante sobrepostos (Figura 10.3A). 

Um efeito principal significativo A seguir, suponha que o efeito principal de 
preda^ao e significativo, mas o do substratos e da intera^ao nao. Portanto, as me¬ 
dias de cada tratamento de preda^ao, calculadas sem a dos tres tratamentos de 
substratos, sao significativamente diferentes umas das outras. Em contrapartida, 
as medias dos tipos de substratos, calculadas sem a media dos diferentes trata¬ 
mentos de preda^ao nao sao substancialmente diferentes umas das outras. O gra- 
fico mostrara aglomera 9 oes de medias diferentes em cada nivel do tratamento de 
preda^ao, mas as de cada tipo de substrato serao praticamente identicas conforme 
o nivel de preda^ao (Figura 10.3B). 

Do contrario, suponha que o efeito do substrato seja significativo, mas que 
o efeito da preda^ao nao. Agora, as medias de cada um dos tres tratamentos de 
substrato sao significativamente diferentes, calculadas pela media dos quatro tra¬ 
tamentos de preda^ao. Contudo, as dos tratamentos de preda^ao nao diferem. As 
tres linhas conectadas para os tipos de substratos serao bem separadas umas das 
outras, mas as suas inclina^oes serao basicamente planas, porque nao ha efeito 
dos quatro tratamentos (Figura 10.3C). 

Dois efeitos principais significativos A proxima possibilidade e um efeito 
significativo da preda^ao e do substrato, mas nao do termo de intera^ao. Neste 
caso, o perfil das respostas medias novamente e diferente para cada tipo de 
substrato, mas ele nao e mais piano ao longo dos tratamentos de preda^ao. 
Uma caracteristica-chave desse grafico e que as linhas que conectam os diferen¬ 
tes grupos de tratamentos sao paralelas umas as outras. Quando os perfis sao 
paralelos, os efeitos dos dois fatores sao estritamente aditivos: uma combina^ao 
dos tratamentos em particular pode ser predita sabendo os efeitos medios de 
cada um dos dois tratamentos individuals. A aditividade dos efeitos do trata¬ 
mento e um perfil paralelo dos tratamentos sao diagnosticos para uma ANOVA 
na qual ambos os efeitos principais sao significativos e o termo de intera^ao 
nao e (Figura 10.3D). 
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Efeito da iNTERAgAo significativo A ultima possibilidade que consideraremos e 
quando o termo de interagao e significativo, mas nenhum dos dois efeitos princi¬ 
pals o sao. Sempre que houver um termo de interagao significativo, as linhas dos 
graficos de perfil ja nao serao (estatisticamente) paralelas (Figura 10.3F) e podem 
ate mesmo se cruzarem caso as interagoes sejam fortes (Figura 10.3E). 

Entendendo os termos de interagao 

Com um termo de interagao significativo, as medias dos grupos de tratamento 
sao bastante diferentes umas das outras, mas nao podemos mais descrever um 
efeito aditivo simples para nenhum dos dois fatores no delineamento. Em vez 
disso, o efeito do primeiro fator (p. ex., predagao) depende do nivel do segundo 
(p. ex., tipo de substrato). Deste modo, as diferengas entre os tipos de substrato 
dependem de qual tratamento de predagao esta sendo considerado. Nas parce- 
las controle e nas sem manipulagao, o recrutamento foi maior em substratos de 
granito; em parcelas com inclusao e exclusao de predadores, o recrutamento foi 
maior em ardosia. Equivalentemente, podemos dizer que o efeito do tratamento 
de predagao depende do substrato. Para substratos de granito, a abundancia e 
maior nos controles; em substratos de ardosia, e maior em tratamentos de inclu¬ 
sao e exclusao de predadores. 

A representagao grafica do termo de interagao, como parcelas nao paralelas 
em relagao as medias dos tratamentos, tambem possui uma interpretagao algebri- 
ca. A partir da Tabela 10.6, a soma dos quadrados para o termo de interagao em 
uma ANOVA de dois fatores e: 


**.-±i±V,-r,-Y l + Y i‘ < 10 - 25 > 

i= 1 j =1 fc=l 

Equivalentemente, podemos adicionar e subtrair um termo Y, dando: 

s Qab =E 2 Z [< f * - f ) ■- (i / -'y )■- :n] : ao j«) 

i=l j =l k=l 

O primeiro termo Y ;j - Y, nessa expressao expandida, representa o desvio da 
media de cada grupo de tratamento para a media geral. O segundo termo Y i - Y 
representa o desvio do efeito aditivo do Fator A. O terceiro termo Y- - Y represen¬ 
ta o efeito aditivo do Fator B. Se os efeitos aditivos dos Fatores A e B juntos descre- 
vem todos os desvios das medias dos tratamentos para a media geral, o efeito da 
interagao e zero. Assim, o termo de interagao mede a extensao na qual as medias 
dos tratamentos diferem dos efeitos estritamente aditivos dos dois fatores princi¬ 
pals. Se nao houver termo de interagao, saber o tipo de substrato e o tratamento 
de predagao nos permite predizer com perfeigao a resposta quando esses dois fa¬ 
tores forem combinados. Mas se houver uma interagao forte, ja nao poderiamos 
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mais predizer os efeitos combinados, mesmo se entendessemos o comportamento 
dos fatores separadamente. 8 * * * * * * lS 

£ evidente o motivo de o termo de intera^ao ser significativo na Figura 10.3E, 
mas por que os efeitos principais nao deveriam ser importantes neste caso? A 
razao e: se tirar a media das medias ao longo de cada tratamento de preda^ao ou 
cada tipo de substrato, elas seriam aproximadamente iguais e nao haveriam dife- 
ren^as consistentes para cada fator considerado de forma isolada. Por esta razao, 
as vezes alega-se que nada pode ser dito sobre os efeitos principais quando os 
termos de intera^ao sao significativos. Esta afirma^ao e verdadeira somente para 
intera^oes muito fortes, nas quais o perfil das curvas se cruzam. Entretanto, em 
muitos casos pode haver tendencias gerais para um unico fator, mesmo quando o 
termo de intera<;ao e significativo. 

Por exemplo, considere a Figura 10.3F, que certamente poderia gerar um ter¬ 
mo de intera^ao estatisticamente significativo em uma ANOVA de dois fatores. 
Essa intera^ao nos diz que as diferen<;as entre as medias para os tipos de substra- 
tos dependem do tratamento de preda^ao. Entretanto, neste caso, a intera^ao sur¬ 
ge principalmente porque o tratamento com substrato de cimento x exclusao do 
predador possui uma media muito pequena em rela^ao aos outros tratamentos. 
Em todos os tratamentos de preda^ao, o substrato de granito (linha preta) possui 
o maior recrutamento e o substrato de cimento (linha verde), o menor. No tra¬ 
tamento controle, as diferen^as entre as medias dos substratos sao relativamente 
pequenas; enquanto no tratamento de exclusao do predador, as diferen^as entre 
medias dos substratos sao relativamente grandes. Novamente, enfatizamos que 
os resultados da ANOVA nao podem ser interpretados de maneira adequada sem 
referenda aos padroes das medias e as variancias dos dados. 

Por fim, note que as transforma^oes dos dados algumas vezes podem eliminar 
os termos de intera«;ao significativos. Em particular, as relates que sao multipli- 
cativas em uma escala linear sao aditivas na escala logaritmica (ver discussao nos 
Capitulos 3 e 8) e a transformaqio logaritmica pode, com frequencia, eliminar os 
termos de intera^ao significativos. Certos delineamentos de ANOVA nao incluem 
termos de intera^ao e temos de assumir aditividade estrita nesses modelos. 

Plotando resultados de ANCOVAs 

Concluiremos esta se 9 ao considerando os possiveis resultados de uma ANCOVA. 
O grafico da ANCOVA deve utilizar a covariavel continua plotada no eixo-x e a 


8 Um exemplo morbido de intera^ao estatistica e o efeito do alcool e dos sedativos na pressao san- 

guinea humana. Suponha que o alcool diminua a pressao sanguinea em 20 pontos, e os sedativos, 

em 15 pontos: em um mundo aditivo simples, a combina^ao de alcool e sedativos deveria dimi- 

nuir a pressao sanguinea em 35 pontos. Em vez disso, a intera<;ao entre alcool e sedativos pode 

diminuir a pressao sanguinea em 50 pontos ou mais e isso frequentemente e letal. Este resultado 

nao poderia ser predito apenas entendendo seus efeitos em separado. As intera^oes sao um pro- 

blema serio, tanto na medicina quanto nas ciencias ambientais. Os estudos experimentais simples 

podem quantificar os efeitos de um unico estressante ambiental, como as eleva^oes de C0 2 ou o 
aumento da temperatura, mas pode haver fortes intera<;6es entre esses fatores que causem resul¬ 
tados inesperados. 
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variavel Y, no eixo -y. Cada ponto representa uma replica independente e simbolos 
e cores diferentes devem ser utilizados para indicar replicas de diferentes trata- 
mentos. Inicialmente, ajuste uma linha de regressao linear para cada grupo de 
tratamento em um grafico geral de resultados. Apresentaremos um unico exem- 
plo onde ha uma covariavel e tres niveis de tratamento sob compara^ao. Eis as 
possibilidades: 

CovariAvel, tratamento e interaqAo nAo significativos Neste caso, as tres li- 
nhas de regressao nao diferem umas das outras e a sua inclina<;ao nao e diferente 
de zero. O intercepto ajustado para cada regressao estima efetivamente a media 
dos valores Y (Figura 10.4A). 

Covariavel significativa, tratamento e interaqAo nAo significativos Neste 
caso, as tres linhas de regressao nao diferem umas das outras, mas agora a incli- 
na 9 ao da linha de regressao universal e significativamente diferente de zero. Os 
resultados sugerem que a covariavel explica a varia^ao nos dados, mas nao ha 
diferen^as entre os tratamentos apos o efeito da covariavel ser (estatisticamente) 
removido (Figura 10.4B). 

Tratamento significativo, covariavel e termo de interaqao nao significati¬ 
vos Neste caso, as linhas de regressao novamente possuem inclina^ao equiva- 
lente a zero, mas agora o intercepto dos tres niveis pode ser diferente, indicando 
um efeito significativo do tratamento. Como a covariavel nao explica muito sobre 
a varia^ao nos dados, o resultado poderia ser qualitativamente o mesmo caso uma 
ANOVA de um fator fosse usada e as medidas da covariavel, ignoradas (Figura 
10.4C). 

Tratamento e covariavel significativos e termo de intera^Ao nAo significa¬ 
tivo Neste caso, as linhas de regressao sao equivalentes, possuem inclina^oes 
diferentes de zero, e os interceptos sao significativamente diferentes. A covariavel 
explica parte da varia^ao nos dados, mas ainda ha varia<;ao do residuo que pode 
ser atribuida ao efeito do tratamento. Este resultado seria equivalente a ajustar 
uma unica linha de regressao ao conjunto de dados inteiro e depois usar os resi- 
duos para testar os efeitos dos tratamentos com uma ANOVA de um fator. Quan- 
do esse resultado e obtido, e apropriado ajustar a inclina^ao da regressao univer¬ 
sal e utilizar a Equa^ao 10.18 para estimar as medias dos tratamentos ajustados 
(Figura 10.4D). 

Termo de interaqAo significativo Este caso representa inclina^oes de regres¬ 
sao heterogeneas, fazendo-se necessario ajustar uma linha de regressao separada, 
com sua propria inclina^ao e intercepto, para cada grupo de tratamento (Figura 
10.4E,F). Quando a intera^ao de tratamento x covariavel e significativa, pode nao 
ser possivel discutir um efeito geral do tratamento, porque a diferen«;a entre tra¬ 
tamentos pode depender do valor da covariavel. Se a intera^ao e forte e as linhas 
das regressoes se cruzarem, a ordem das medias dos tratamentos sera invertida 
nos valores altos e baixos da covariavel (Figura 10.4E). Se o efeito do tratamento 
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e forte, a ordem das medias dos tratamentos pode permanecer a mesma para va- 
lores diferentes da covariavel, mesmo que o termo de intera^ao seja significativo 
(Figura 10.4F). 

COMPARANDO MEDIAS 

Na se<;ao anterior, enfatizamos que comparar as medias de diferentes grupos de 
tratamentos e essencial para interpretar corretamente os resultados da analise 
de variancia. Mas como decidimos quais medias sao verdadeiramente diferentes 
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Figura 10.4 Possiveis resultados para experimentos com delineamentos de ANCOVA. Em cada 
painel, si'mbolos diferentes indicam replicas em cada urn dos tres grupos tratamentos. Cada painel 
indica urn diferente resultado experimental possivel com o resultado da ANCOVA associado. (A) 
Efeitos do tratamento e da covariavel nao significativos. Os dados sao melhor ajustados por uma 
unica media geral com erro amostral. (B) Efeito da covariavel significativo, efeito do tratamento nao 
significativo. Os dados sao melhor ajustados por uma unica linha de regressao sem diferen^as entre 
tratamentos. (C) Efeito do tratamento significativo, covariavel nao significativa. 0 termo da covaria¬ 
vel nao e significativo (inclina^ao da regressao = 0) e os dados sao melhor ajustados por urn modelo 
com medias de grupos diferentes, como em uma ANOVA de urn fator simples. (D) 0 tratamento e 
a covariavel sao significativos. Os dados sao melhor ajustados por urn modelo de regressao com 
uma inclina^ao comum, mas interceptos diferentes para cada grupo de tratamento. Este modelo e 
utilizado para calcular medias ajustadas, estimadas para a media geral da covariavel. (E) A intera^ao 
tratamento x covariavel em que a ordem das medias dos tratamentos difere para diferentes valores 
da covariavel. As indina$6es da regressao sao heterogeneas e cada grupo de tratamento possui 
uma indina^ao e intercepto diferentes. (F) Uma interagao tratamento x covariavel na qual a ordem 
dos grupos de tratamentos nao difere para os diferentes valores da covariavel. Tanto o tratamento 
quanto a intera^ao tratamento x covariavel sao significativos. 


umas das outras? A ANOVA testa apenas a hipotese nula de que as medias dos 
tratamentos foram todas amostradas a partir da mesma distribui^ao. Se rejeitar- 
mos essa hipotese nula, os resultados nao especificam quais medias em particular 
diferem uma da outra. 

Para comparar diferentes medias, ha duas maneiras. Com compara^oes a 
posteriori (“depois do fato”), utilizamos um teste em todos os pares possiveis de 
medias dos tratamentos para determinar quais sao diferentes um do outro. Com 
contrastes a priori (“antes do fato”), especificamos antecipadamente as combi- 
na<;6es em particular de medias que desejamos testar. Tais combina^oes com fre- 
quencia refletem hipoteses especificas que estamos interessados em avaliar. 

Embora os contrastes a priori geralmente nao sejam utilizados por ecologos 
e cientistas da area ambiental, somos favoraveis por duas razoes: primeiro, como 
eles sao mais especificos, em geral sao mais poderosos que testes generalizados de 
diferen^as entre todos os pares de medias. Segundo, o uso de contrastes a priori 
for^a o investigador a pensar com clareza acerca de quais diferen^as de tratamen¬ 
tos, em particular, sao de interesse e como elas estao relacionadas com as hipote¬ 
ses a serem abordadas. 

Ilustramos tanto as abordagens a priori quanto as a posteriori com a analise 
de um simples delineamento de ANOVA. Os dados sao de Ellison et al. (1996), 
que estudaram a intera^ao entre as raizes do Mangue-vermelho ( Rhizophora man¬ 
gle) e esponjas epibentonicas. O mangue esta entre as poucas plantas vasculares 
que podem crescer em agua salgada, sendo que, pantanos tropicais protegidos, 
formam florestas densas, margeando a costa. As raizes-escoras do mangue se es- 
tendem para baixo no substrato e sao colonizadas por numerosas especies de es¬ 
ponjas, cracas, algas, pequenos invertebrados e microbios. A assembleia animal 
obviamente se beneficia desse substrato duro disponivel, mas existe algum efeito 
sobre as plantas? 

Ellison et al. (1996) queriam determinar experimentalmente se havia efei¬ 
tos positivos de duas especies comuns de esponjas no crescimento da raiz de 
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Rhizophora mangle. Eles estabeleceram quatro tratamentos, com 14 a 21 repli¬ 
cas em cada. 9 Os tratamentos foram os seguintes: (1) sem manipula^ao; (2) 
espuma grudada em raizes descobertas de mangue (trata-se de um controle 
de “esponja falsa” que Simula a hidrodinamica e outros efeitos fisicos de uma 
esponja viva, mas e biologicamente inerte 10 ); (3) colonias vivas de Tedania ig¬ 
nis (esponja de fogo) transplantadas para raizes descobertas de mangue; (4) 
colonias vivas de Haliclona implexiforms (esponja purpura) transplantadas 
para raizes descobertas de mangue. As replicas foram estabelecidas pre-sele- 
cionando de maneira aleatoria raizes descobertas de mangue. Os tratamentos 
foram desordenadamente atribuidos para as replicas. A variavel resposta foi o 
crescimento da raiz do mangue, medido em mm/dia para cada uma das repli¬ 
cas. A Tabela 10.12 apresenta a analise de variancia para esses dados e a Figura 
10.5 ilustra os padroes entre as medias. O valor de P para a razao-F e altamente 
significativo (F 3 52 = 5,286, P - 0,001) e os tratamentos explicam 19% da varia- 
<;ao nos dados (calculo feito utilizando a Equa^ao 10.23). O proximo passo e 
focar em quais medias de tratamentos em particular sao diferentes umas das 
outras. 

Com parades a posteriori 

Utilizaremos o teste de “diferen^a honestamente significante” de Tukey (DHS; 
Honestly Significant Difference ) para comparar as medias dos quatro tratamentos 
no experimento de crescimento do mangue. Este e um de muitos procedimen- 
tos a posteriori disponiveis para comparar pares de medias apos uma ANOVA." 


y O delineamento completo, na verdade, e um bloco aleatorizado com tamanhos amostrais desiguais, 
mas o trataremos com uma ANOVA simples de um fator para ilustrar as compara^oes de medias. 
Para o nosso exemplo simplificado, analisamos apenas 14 replicas aleatoriamente escolhidas para 
cada tratamento. Portanto, nossa analise e completamente balanceada. 

10 O controle de espuma em particular merece aten^ao especial. Neste livro, discutimos controles 
experimentais e tratamentos falsos que consideram os efeitos de manipula^ao e de outros artefatos 
experimentais que queremos distinguir dos efeitos biologicos significativos. Neste caso, o controle de 
espuma e utilizado de uma maneira diferenciada. Ele controla os efeitos fisicos (p. ex., hidrodinami¬ 
ca) do corpo de uma esponja que perturba o fluxo da corrente e potencialmente afeta o crescimento 
das raizes de mangue. Portanto, o controle de espuma nao necessariamente controla qualquer artefa- 
to de manipula^ao, porque as replicas em todos os quatro tratamentos foram medidas e manipuladas 
da mesma maneira. Em vez disso, esse tratamento nos permite fazer a parti<;ao dos efeitos de colonias 
de esponjas vivas (que secretam e apanham uma variedade de minerais e compostos organicos) dos 
efeitos da fixa^ao de uma estrutura em forma de esponja (que e biologicamente inerte, mas ainda 
assim altera a hidrodinamica). 

11 Day 8c Quinn (1989) discutem extensamente os diferentes testes posteriores a ANOVA e seus pon- 
tos fortes e fracos. Nenhuma das alternativas e inteiramente satisfatoria. Alguns sofrem muito com 
erros Tipo I e Tipo II e outros sao sensiveis a tamanhos amostrais desiguais ou a diferen^as na varian¬ 
cia entre grupos. A DHS de Tukey controla as compara^oes multiplas, embora seja ligeiramente con- 
servadora com um potencial risco de erro Tipo II (nao rejeitar a H 0 quando ela e falsa). Ver , tambem, 
Quinn 8c Keough (2002) para uma discussao das diferentes escolhas. 
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TABELA 10.12 Tabela da analise de variancia para um experimento 

testando os efeitos de esponjas no crescimento de raizes de 
Mangue-vermelho 


Fonte 

Graus de 
liberdade (gl) 

Soma dos 
quadrados ( SQ ) 

Quadrado 
medio (QM) 

Razao-F 

Valor de P 

Tratamentos 

3 

2,602 

0,867 

5,286 

0,003 

Residuos 

52 

8,551 

0,164 



Total 

55 

11,153 





Nesta analise, quatro tratamentos foram estabelecidos (sem manipula^ao, espuma e dois tratamentos com 
esponjas vivas) contando com 14 replicas cada (tamanho amostral total =14x4 = 56). A razao-F para o 
efeito do tratamento e bastante significativa, indicando que as taxas de crescimento medio das raizes do 
mangue diferem entre os quatro tratamentos. As medias e os desvios-padrao do crescimento da raiz (mm/ 
dia) para cada tratamento sao ilustrados na Figura 10.6. (Dados de Ellison et al., 1996.) 


O teste DHS de Tukey controla estatisticamente o fato de estarmos realizando 
muitas compara^oes simultaneas. Portanto, o valor de P deve ser ajustado para 
baixo em cada teste individual para obter uma taxa de erro sensata do experi¬ 
mento de a = 0,05. Na proxima se 9 ao, discutiremos em mais detalhes o proble- 
ma geral de como lidar com valores multiplos de P em um estudo. O primeiro 
passo e calcular o DHS: 

_ 1,75-1 

ro - 

| 1,50 - - 

E. 

n 1,25 - T 


TO 



Sem manipula<;ao Espuma Haliclona Tedania 


Figura 10.5 Taxa de crescimento medio (mm/dia) de raizes de mangue em quatro tratamen¬ 
tos experimentais. Os tratamentos foram estabelecidos (sem manipulagao, espuma e dois trata¬ 
mentos com esponjas vivas), com 14 replicas em cada um. A altura da barra e a media da taxa de 
crescimento para o tratamento e as barras de erro verticals sao de um desvio-padrao ao redor da 
media. As barras em verde-escuro indicam esponjas vivas, a verde-dara e a espuma inerte e a 
barra nao sombreada e a media para as raizes sem manipula^ao. As linhas horizontais juntam os 
grupos tratamentos que nao diferem significativamente pelo teste de DSH de Tukey (ver Tabela 
10.13). (Dados de Ellison et al., 1996. As analises estatisticas desses dados estao presentes nas 
Tabelas 10.12 a 10.15.) 
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IF 


DHS = q 


—+ — 

n . ti: . 

1 ) J 


QM resU 


residuo 


(10.27) 


onde qeo valor tirado de uma tabela estatistica da distribui^ao de amplitude nor- 
malizada ( studentized range distribution), n, e sao os tamanhos amostrais para 
as medias dos grupos i e; sob compara^ao e QM residuo e o habitual quadrado medio 
do residuo da tabela de ANOVA de um fator. Para os dados na Tabela 10.12: q = 
3,42 (retirado de um conjunto de tabelas estatisticas), n, e n- - 14 replicas para 
todas as medias, QM. residuo - 0,164 e o DHS calculado = 0,523. 

Portanto, qualquer par de medias entre os quatro tratamentos que diferem 
por pelo menos 0,523 em crescimento diario medio da raiz e significativamente 
diferente a um P = 0,05. A Tabela 10.13 mostra a matriz de diferen^as par-a-par 
entre cada uma das medias e os valores de P correspondentes calculados pelo teste 
de Tukey. 

A analise sugere que as raizes sem manipula^ao diferem bastante do cresci¬ 
mento de raizes com esponjas implantadas. Os dois tratamentos com esponjas 
vivas nao diferem tanto um do outro ou do tratamento com espuma. Entretan- 
to, esse tipo de tratamento foi marginalmente nao significative (P = 0,07) se 
comparado com as raizes sem manipula^ao. Esses padroes sao ilustrados gra- 
ficamente na Figura 10.5, na qual as linhas horizontais sao colocadas sobre os 
conjuntos de medias dos tratamentos que nao diferem de maneira significativa 
uns dos outros. 

Embora esses testes par-a-par revelem os pares de tratamentos em particular 
que diferem, o teste DHS de Tukey e outros testes a posteriori podem indicar, por 
vezes, que nenhum dos pares de medias sao significativamente diferentes uns dos 
outros, mesmo que a razao-F total o leve a rejeitar a hipotese nula! Esse resultado 
inconsistente pode surgir porque os testes par-a-par nao sao tao poderosos quan¬ 
to a razao-F global e por si so. 

Contrastes a priori 

Os contrastes a priori sao muito mais poderosos, tanto estatistica quanto lo- 
gicamente, que os testes de todos os pares a posteriori. A ideia e estabelecer 
contrastes, ou compara^oes especificadas entre conjuntos de medias em par¬ 
ticular que testam hipoteses especificas. Se seguirmos certas regras matemati- 
cas, um conjunto de contrastes sera ortogonal ou independente dos outros e 
ira realmente representar a parti^ao matematica da soma dos quadrados entre 
grupos. 

Para criar um contraste, primeiro atribuimos um numero inteiro (positivo, 
negativo ou 0) para cada grupo de tratamento. Este conjunto de coeficientes intei- 
ros e o contraste em teste. Aqui estao as regras para construir contrastes: 
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TABELA 10.13 Diferen«;as medias entre todos os possiveis pares de tratamentos 
em um estudo experimental dos efeitos de esponjas sobre o 
crescimento de raizes do Mangue-vermelho 



Sem 

manipulate) 

Espuma 

Haliclona 

Tedania 

Sem 

manipula^ao 

Espuma 

Haliclona 

0,000 

0,383 (0,072) 

0,436 (0,031) 

0,000 

0,053 (0,986) 

0,000 


Tedania 

0,584 (0,002) 

0,202 (0,557) 

0,149 (0,766) 

0,000 


Nesta analise, quatro tratamentos foram estabelecidos (sem manipulate*, espuma e dois tratamentos com 
esponjas vivas), com 14 replicas cada (tamanho amostral total =14x4 = 56). A ANOVA e indicada na 
Tabela 10.12. Essa tabela ilustra as diferen^as entre as medias dos tratamentos. Cada valor e a diferen^a 
em crescimento medio das raizes (mm/dia) entre um par de tratamentos. A diagonal da matriz compara 
cada tratamento com ele mesmo, portanto as diferen<;as sao sempre zero. O valor entre parenteses e a 
probabilidade de cauda associada com base no teste DHS de Tukey. Esse teste controla o nivel de a para 
levar em conta o fato de que seis testes par-a-par foram realizados. Quanto maior a diferen^a entre os 
pares de medias, menor e o valor de P. As raizes sem manipulate* diferem bastante dos dois tratamentos 
com esponjas vivas ( Tedania , Haliclona). As diferen^as entre todos os outros pares de medias nao sao 
significativas. Entretanto, a compara^ao entre os tratamentos sem manipulate* e com espuma e apenas 
marginalmente acima do nivel de P = 0,05, enquanto o com espuma nao difere de maneira significativa 
de nenhum dos tratamentos com esponjas vivas. Esses padroes estao ilustrados na forma grafica na Figura 
10.5. (Dados de Ellison et al., 1996.) 


1. A soma dos coeficientes para um contraste em particular deve ser igual a 0. 

2. Aos grupos de medias que precisam ser calculadas em conjunto sao atribui- 
dos o mesmo coeficiente. 

3. As medias que nao estao incluidas na compara^ao de um contraste em parti¬ 
cular sao atribuidas um coeficiente 0. 

Vamos tentar isto para o experimento com mangue. Se o tecido de esponjas 
vivas aumenta o crescimento das raizes, entao a media de crescimento nos dois 
tratamentos com esponjas vivas deveria ser maior que o das raizes no tratamento 
da espuma inerte. 

Nossos valores de contraste sao: 

Contrate I controle (0) espuma (2) Tedania (- 1) Haliclona (-1) 

Haliclona e Tedania recebem o mesmo coeficiente (-1) porque queremos 
comparar a media desses dois tratamentos com o da espuma. O controle recebe 
um coeficiente 0 porque estamos testando uma hipotese sobre os efeitos de es¬ 
ponjas vivas, portanto a compara^ao relevante e apenas com a espuma. A espuma 
recebe um coeficiente 2 de forma que ela seja balanceada pela media das duas 
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esponjas vivas e a soma dos coeficientes seja 0. Equivalentemente, voce poderia 
ter atribuido coeficientes (0) para o controle, (6) para espuma, (-3) para Tedania 
e (-3) para Haliclona e, por fim, obter o mesmo contraste. 

Uma vez que o contraste £ estabelecido, construimos um novo quadrado me¬ 
dio com grau de liberdade associado. Voce pode pensar nisto como um quadrado 
medio ponderado, no qual os pesos sao os coeficientes que refletem a hipotese. O 
quadrado medio para cada contraste calculado como: 



V 

n 

L'* 

Q^contrastt ~ 

-- - (10.28) 




M 


O termo entre parenteses 6 apenas a soma de cada coeficiente (c ) multiplica- 
da pela media do grupo correspondente (V,). Para o nosso primeiro contraste, o 
quadrado medio da espuma versus esponja viva t. 


QA1 


espuma vs espsmpis 


((0)(0,3293)+(2)0,712l)+(—1 )(0,7650)+(-l )(0,9136)) 2 x 14 
0 2 + 2 2 +(-l)+(-l)' 


=0,1510 (10.29) 


Esta media quadrada possui 1 grau de liberdade e foi testada contra o quadra¬ 
do medio do erro. A razao-F £ 0,151/0,164 = 0,921, com um valor de P associado 
de 0,342 (Tabela 10.14). Este contraste sugere que a taxa de crescimento das raizes 
de mangue cobertas com espuma 6 comparavel 4s taxas de crescimento das raizes 
cobertas com esponjas vivas. Este resultado faz sentido porque as medias desses 
tres grupos de tratamentos sao bastante similares. 

Nao ha limite para o niimero de contrastes em potential que podemos criar. 
Entretanto, goslariamos que nossos contrastes fossem ortogonais uns aos outros, 
de forma que os resultados fossem logicamente independentes. Os contrastes or¬ 
togonais garantem que os valores de P nao sejam excessivamente inflados ou cor- 
relacionados entre si. Com o intuito de criar contrastes ortogonais, duas regras 
adicionais devem ser seguidas: 

4. Se existem a grupos de tratamentos, haveria pelo menos (a - 1) contrastes 
ortogonais criados (embora haja muitos conjuntos possiveis de tais con¬ 
trastes). 

5. Todos os pares de produtos cruzados devem somar 0 (vcr Apendice). Em ou- 
tras palavras, um par de contrastes Q e R£ independente se a soma dos pro¬ 
dutos de seus coeficientes e c Rl 6 igual a zero: 
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^'. c m c Ri — 0 ( 10 . 30 ) 

i=i 

Construir contrastes ortogonais se assemelha a resolu^ao de palavras cruzadas. 
Uma vez que o primeiro contraste e estabelecido, ele restringe as possibilidades 
para os remanescentes. Para os dados de raizes de mangue, podemos construir dois 
contrastes ortogonais adicionais para juntar ao primeiro. O segundo contraste e: 

Contraste II controle (3) espuma(-l) Tedania{- 1) Haliclona (-1) 

Este contraste soma zero: ele e ortogonal ao primeiro porque satisfaz a regra 
dos produtos cruzados (Equa<;ao 10.30): 

(0)(3) + (2)(-l) + (-!)(-!) + (-!)(-!) = 0 ( 10 . 31 ) 


O segundo contraste compara o crescimento das raizes no controle com a me¬ 
dia do crescimento das com espuma e com as duas esponjas vivas. Esse contraste 
testa se o aumento no crescimento de raiz reflete propriedades das esponjas vivas 
ou apenas as consequencias fisicas de uma estrutura fixada. Esse contraste da uma 
razao-F bem grande (14,00), que e muito significativa (Tabela 10.14). Novamente 
esse resultado faz sentido, pois o crescimento medio das raizes sem manipula^ao 
(0,329) e substancialmente menor que o do tratamento com espuma (0,712) ou 
que qualquer um dos dois tratamentos com esponjas vivas (0,765 e 0,914). 

Um ultimo contraste ortogonal pode ser criado: 

Contraste III controle (0) espuma (0) Tedania ( 1) Haliclona (-1) 

Os coeficientes deste contraste novamente somam zero e ele e ortogonal aos 
dois primeiros, pois a soma dos produtos cruzados e zero (Equa^ao 10.30). O 
terceiro contraste testa as diferen^as na taxa de crescimento das duas especies de 
esponjas vivas, mas nao avalia a hipotese de mutualismo. Ele e de menor interesse 
que os outros dois, mas e o unico contraste que pode ser criado ortogonal aos dois 
primeiros. Esse contraste produz uma razao-F de apenas 0,947, com um valor de 
P correspondente de 0,335 (Tabela 10.14). Mais uma vez, este resultado e espe- 
rado porque as taxas de crescimento medio das raizes nos dois tratamentos com 
esponjas vivas sao similares (0,765 e 0,914). 

Note que a soma dos quadrados para cada um dos tres contrastes totaliza para 
soma dos quadrados dos tratamentos: 


SQ 

tratamento =SQ 

contraste l+ ^Qcontraste II ^Qcontraste III 

2,602 = 0,151 + 2,296 + 0,155 


( 10 . 32 ) 
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Em outras palavras, acabamos de fazer a parti<;ao da soma total dos quadra- 
dos entre grupos em tres contrastes ortogonais e independentes. Isto e similar ao 
que acontece em uma ANOVA de dois fatores, na qual fazemos a decomposi^ao 
da soma global dos quadrados dos tratamentos em dois efeitos principais e um 
termo de intera^ao. 

Este conjunto de tres contrastes nao e a unica possibilidade. Tambem pode- 
riamos ter especificado esse conjunto de contrastes ortogonais: 

Contraste I controle(l) espuma(l) Tedania(- 1) Haliclona (-1) 

Contraste II controle(l) espuma(-l) Tedania( 0) Haliclona (0) 

Contraste III controle (0) espuma (0) Tedania(l) Haliclona (-1) 

O Contraste I compara o crescimento medio de raizes cobertas com as es- 
ponjas vivas com o dos dois tratamentos sem esponjas vivas. O Contraste II 
compara especificamente o crescimento das raizes do controle versus as raizes 
cobertas com espuma. O contrate III compara taxas de crescimento das raizes 
cobertas com Haliclona versus raizes cobertas com Tedania. Estes resultados (Ta- 
bela 10.15) sugerem que esponjas vivas incrementam o crescimento das raizes, 
em compara«;ao as raizes sem manipula<;ao ou aquelas cobertas com espuma. 
Entretanto, o Contraste II revela que o crescimento das raizes com espuma teve 
um incremento em compara^ao com controles sem manipula^ao, sugerindo 
que o crescimento de raizes de mangue responde a hidrodinamica ou a alguma 
outra propriedade flsica das esponjas aderidas em vez da presen^a de tecidos 
vivos de esponjas. 

Qualquer um dos conjuntos de contrastes e aceitavel, embora pensemos que 
o primeiro conjunto endere^a mais diretamente os efeitos da hidrodinamica ver¬ 
sus as esponjas vivas. Por fim, notamos que pode haver pelo menos dois contrastes 
nao ortogonais interessantes. Eles podem ser: 

controle (0) espuma (1) Tedania (- 1) Haliclona (0) 
controle (0) espuma (1) Tedania (0) Haliclona (-1) 

Esses contrastes comparam o crescimento de raizes de cada uma das esponjas 
vivas com o de raizes com o controle de espuma. Ambos nao sao significativos 
(Tedania F, 52 = 0,12, P = 0,73; Haliclona F, 52 = 0,95, P = 0,33), novamente suge¬ 
rindo que o efeito das esponjas vivas sob re o crescimento de raizes de mangue e 
semelhante ao da espuma biologicamente inerte. Entretanto, esses dois contrastes 
nao sao ortogonais um ao outro (ou aos nossos outros contrastes), porque seus 
produtos cruzados nao somam zero. Portanto, esses valores de P calculados nao 
sao completamente independentes dos valores de P que calculamos com os outros 
dois conjuntos de contrastes. 

Neste exemplo, as compara^oes a posteriori utilizando o teste DHS de Tukey 
deram resultados um pouco amblguos porque nao foi posslvel separar, com cla- 
reza, os valores medios com base em compara^oes par-a-par (Tabela 10.13). Os 
contrastes a priori (em oposi^ao) deram resultados muito mais claros, com uma 
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TABELA 10.14 Contrastes a priori para analise de variancia dos efeitos de esponjas no 
crescimento de raizes de mangue 

Fonte 

Graus de 
liberdade (gl) 

Soma dos 
quadrados (SQ) 

Quadrado 
medio (QM) 

Razao-F 

Valor de P 

Tratamentos 

3 

2,602 

0,867 

5,287 

0,026 

Espuma vs. esponjas 

1 

0,151 

0,151 

0,921 

0,342 

Sem manipula<;ao vs. 

1 

2,296 

2,296 

14,000 

<0,001 

esponjas, espuma 






Tedania vs. Haliclona 

1 

0,155 

0,155 

0,945 

0,335 

Residuo 

52 

8,539 

0,164 



Total 

56 

11,141 





Os tratamentos foram estabelecidos conforme as Tabelas 10.12 e 10.13. Acabamos de fazer a parti^ao de um simples 
teste da ANOVA de um fa tor dos efeitos do tratamento em tres contrastes independentes, cada um com 1 grau de li- 
berdade. Cada contraste e testado contra o quadrado medio dos residuos. A analise revela que o crescimento de raizes 
sem manipula^ao e muito diferente do crescimento medio daquelas cobertas com esponjas vivas ou com espuma. 
Nao houve diferen^a significativa entre o crescimento de raizes com espuma e com esponjas vivas. O mesmo entre o 
crescimento de raizes cobertas com as duas especies diferentes de esponjas (Tedania e Haliclona). Note que foi feita 
a parti<;ao dos tres graus de liberdade e da soma dos quadrados do efeito total dos tratamentos em tres componentes 
aditivos, cada um deles testa uma hipotese a priori mais especifica acerca das diferen<;as entre medias. (Dados de Elli¬ 
son et al., 1996.) 


evidente rejei^ao da hipotese nula e a confirma^ao de que os efeitos das esponjas 
podem ser atribuidos aos efeitos fisicos da colonia de esponjas, e nao necessa- 
riamente a qualquer efeito biologico das esponjas vivas (Tabelas 10.14, 10.15). 
Os contrastes a priori tiveram mais sucesso por serem mais especificos e mais 
poderosos que os testes de compara^ao par-a-par. Note, tambem, que analises 
par-a-par necessitaram de seis testes, enquanto os contrastes utilizam apenas tres 
compara^oes especificas. 

Uma nota de advertencia: contrastes a priori realmente precisam ser estabe¬ 
lecidos a priori - ou seja, antes de voce ter analisado os padroes das medias dos 
tratamentos! Se forem estabelecidos agrupando tratamentos com medias simi- 
lares, os valores de P resultantes sao inteiramente falsos e a chance de erro Tipo 
I (rejeitar erroneamente a hipotese nula) e grande. Se voce nao tiver contrastes 
verdadeiramente a priori , e apenas deseja determinar quais medias sao diferentes, 
deve usar, entao, um dos metodos a posteriori. 

Em resumo, contrastes a priori sao ferramentas poderosas, porem subutili- 
zadas, que permitem a voce comparar conjuntos de medias que sao em particu¬ 
lar relevantes para suas hipoteses. Eles sao faceis de calcular e tambem podem 
ser prontamente aplicados a ANOVAs de dois fatores e em delineamentos mais 
complexos. De fato, voce ainda pode usar contrastes a priori para fazer a parti^ao 
dos efeitos principals e dos termos de intera«;ao, como em uma ANOVA de dois 
fatores-padrao. Somos favoraveis a contrastes a priori bem pensados em vez dos 
numerosos testes de compara^oes a posteriori disponiveis. 
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TABELA 10.15 Um conjunto alternative de contrastes a priori para a analise de 
variancia dos efeitos de esponjas sobre o crescimento de raizes de 
mangue 



Graus de 

Soma dos 





liberdade 

quadrados 

Quadrado 



Fonte 

(gD 

(SQ) 

medio (QM) 

Razao-F 

Valor de P 

Tratamentos 

3 

2,602 

0,867 

5,275 

0,003 

Sem manipula^ao, 
espuma vs. esponjas 

1 

1,425 

1,425 

8,687 

0,005 

Sem manipula^ao 
vs. espuma 

1 

1,027 

1,027 

6,261 

0,016 

Tedania vs. Haliclona 

1 

0,155 

0,155 

0,947 

0,335 

Residuo 

52 

8,551 

0,164 



Total 

56 

11,153 





Os tratamentos foram estabelecidos conforme as Tabelas 10.12 e 10.13. Novamente, foi feita a parti<;ao 
de um simples teste de ANOVA de um fator dos efeitos do tratamento (Tabela 10.12) em tres contrastes 
independentes, cada um com 1 grau de liberdade. Cada contraste e testado contra o quadrado medio dos 
residuos. Estes contrastes sao ligeiramente diferentes daqueles da Tabela 10.14. O primeiro contraste indica 
que a taxa de crescimento de raizes de mangue foi maior nos tratamentos com esponjas vivas que nos trata¬ 
mentos com espuma ou sem esponjas. O segundo contraste indica que o crescimento das raizes foi tambem 
incrementado pelo tratamento com espuma em compara^ao ao dos controles. Nao houve diferen<;a signifi- 
cativa entre o crescimento de raizes cobertas com as duas especies de esponjas (Tedania e Haliclona). Note 
que foi feita a parti<;ao dos 3 graus de liberdade e da soma dos quadrados do efeito total dos tratamentos 
em 3 componentes aditivos, cada um deles testa uma hipotese a priori mais especifica acerca das diferen^as 
entre medias. (Dados de Ellison et al., 1996.) 


CORRE0ES DE B0NFERR0NIE 0 PR0BLEMA DOS TESTES MULTIPL0S 

Em nossa discussao de contrastes a priori e de compara^oes a posteriori, fizemos 
alusao ao problema de compara^oes multiplas. Tanto os contrastes a priori quanto 
o teste DHS de Tukey controlam internamente o numero de diferentes compara- 
^oes estatisticas que sao feitas. Mas esse tipo de controle nao esta presente quando 
comparamos os resultados de testes multiplos. 

A dificuldade e que quanto mais testes estatisticos forem realizados, mais pro- 
vavel sera que um valor de P menor que 0,05 seja obtido em um ou mais desses 
testes, mesmo que os padroes reflitam apenas erro aleatorio. Por exemplo, se voce 
conduzir 20 testes estatisticos independentes e a hipotese nula for verdadeira em 
todos, ainda assim, voce esperaria rejeitar a hipotese nula 5% das vezes, o que 
seria aproximadamente (5%) x 20 = 1 teste estatistico. Portanto, muitos autores 
defendem que voce ajuste o nivel aceitavel de erro Tipo I (a) quando estiver con- 
duzindo testes multiplos. 
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O metodo de Bonferroni e para estabelecer a taxa de erro por experimento 

e dividi-la pelo numero de testes para obter um nivel a ajustado (a’) para cada 
teste individual: 


a' = a Ik (10.33) 

onde a e a taxa de erro por experimento, keo numero de testes comparados e a’ 
e o nivel do alfa ajustado para cada teste individual. Desta forma, com 20 testes es- 
tatisticos e uma taxa de erro por experimento de 0,05, apenas poderiamos rejeitar 
a hipotese nula de qualquer teste em particular se P < a\ que pela Equa^ao 10.33 
= 0,05/20 = 0,0025. 

O procedimento de Bonferroni e desnecessariamente conservador, porque 
nao considera os casos em que mais de um teste e simultaneamente rejeitado. 
Uma corre^ao mais adequada e o metodo de Dunn-Sidak, que e o calculo corre- 
to da probabilidade de rejeitar a hipotese nula pelo menos uma vez, com base em 
regras simples da probabilidade e da combinatoria (Capitulo 2). Se a’ e o nivel 
de alfa ajustado, entao a probabilidade de nao cometer nenhum erro Tipo I em 
k testes e: 


P(nenhum erro Tipo I) = (1 - a') k (10.34) 

A probabilidade de fazer pelo menos um erro Tipo I, que e a taxa por experi¬ 
mento, e, portanto, 

P {pelo menos um erro Tipo I) = a = 1 - (1 - o!) k (10.35) 

Rearranjando, nos termos do nivel do alfa ajustado, para cada teste individual 
temos: 


a' = l-(l-a)* (10.36) 

Para o exemplo dos 20 testes independentes, com uma taxa de erro por ex¬ 
perimento de 0,05, temos um valor critico de a’ = 1 - (1 - 0,05) 1/20 = 0,00256, 
ligeiramente maior que a simples corre^ao de Bonferroni de 0,00250. 

Esses tipos de corre^oes sao muito populares entre os editores e revisores de 
periodicos e com frequencia aparecem em artigos publicados. Entretanto, nao fa- 
vorecemos nenhum desses ajustes do nivel de alfa e o encorajamos a nao os usar, 
a menos que sua mao seja for^ada por um editor. 

Por que estamos argumentando contra um padrao aceito? Aqui estao os 
problemas em ajustar o a. Primeiro, as analises assumem que os testes sao to- 
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dos independentes, o que raras vezes sao. Se os testes nao sao independentes, 
o procedimento e muito conservative (levando a uma alta probabilidade de 
um erro Tipo II). Segundo, as analises sao predicadas na ideia de que todas as 
hipoteses nulas sao verdadeiras, o que mais uma vez representa uma condi^ao 
extrema. 

Mas a obje^ao mais importante e que o ajuste do a vai contra o senso comum. 
Uma razao importante para usar o a padrao para rejeitar ou aceitar uma hipotese 
nula e que o mesmo padrao de evidencia e aplicado a todos os testes de hipoteses 
na literatura cientifica (Capitulo 4). Porem, se o a for ajustado em cada estudo, o 
padrao de repente deixa de existir. E qual e precisamente o espa^o amostral com 
que esses ajustes devem ser feitos: o numero de testes em um artigo em particular? 
No fasciculo de um periodico como um todo? Ou, talvez, o numero de testes rea- 
lizados durante a vida dos pesquisadores ao longo de suas carreiras? Argumentos 
legitimos podem ser feitos para cada um desses. 

O ajuste efetivo dos a’s e uma penaliza<;ao aos investigadores por conduzirem 
testes multiplos, pois o padrao para a rejei<;ao da hipotese nula aumenta quanto 
mais testes sao realizados. No entanto, muitas vezes o padrao com que os testes 
sao rejeitados e a chave para distinguir entre as diferentes hipoteses cientificas. 12 O 
ajuste dos a’s nos fazem jogar fora precisamente essa pe^a chave de informa^ao. 

Na verdade, se os testes fossem verdadeiramente independentes, alguem 
poderia argumentar que os ajustes dos a’s na verdade deveriam ser feitos em 
outra dire<;ao! Por exemplo, suponha que conduzimos tres experimentos in¬ 
dependentes para testar uma hipotese em particular e que o nfvel de a para 
rejeitar a hipotese nula em cada caso e de 0,11. Para qualquer teste individual, 
isso seria algo em torno de 0,05. Porem, com os metodos de Bonferroni ou de 
Dunn-Sidak, nao estamos nem proximos do nfvel de rejei^ao necessario (a = 
0,0167 e a = 0,0169). 

Mas nao deveriamos hear desconfiados? Afinal, se as hipoteses nulas sempre 
eram verdadeiras, quais sao as chances de obter um P = 0,11 tres vezes em uma 
linha? A combina^ao de probabilidades de Fisher avalia uma sequencia de va- 



'"Rosenzweig & Abramsky (1997) se referem a avalia^ao de multiplas 
pe^as de evidencia como “teste de interruptor DIP” Cada teste repre¬ 
senta um interruptor DIP diferente, e o padrao coletivo em que os 
interruptores sao “ligados” fornece uma evidencia cumulativa a favor 
ou contra uma hipotese em particular. Um interruptor DIP, ou mais 
precisamente um de duplo encapsulamento ( Dual-Inline Package) - ou 
seja, com duas posi^oes (ligado e desligado) e usado em computa- 
dores modernos para configurar o hardware. A fotografia ilustra oito 
interruptores DIP que podem ser arranjados em 2 8 = 256 combina^oes de ligado e desligado. Os 
interruptores DIP substituiram os jumpers, que tinham que ser movidos manualmente em placas de 
circuitos antigas. 


Interruptor DIP 
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lores de probabilidades independentes. 13 O teste estatistico para combina^ao de 
probabilidades (CP) e calculado como: 


k 

CP = -2^ln(Pi) (10.37) 

i=i 

onde k e o numero de testes independentes e ln(p ( ) e o logaritmo natural da 
probabilidade de cauda para o teste i. A estatistica CP segue uma distribui- 
^ao de chi-quadrado (ver Capitulo 11 para uma discussao detalhada de uma 
distribui^ao de chi-quadrado) com 2 n graus de liberdade. Para tres testes in¬ 
dependentes, cada um com P de 0,11, CP = 13,24, com 6 graus de liberdade. 
Para os valores tabelados da distribui^ao de chi-quadrado, a combina^ao de 
probabilidades de cauda e 0,039, que podemos declarar como estatisticamente 
significativa. Isso tern sentido intuitivo, porque em um conjunto de tres expe- 
rimentos de uma distribui^ao verdadeiramente aleatoria seria improvavel de 
gerar tres valores de P tao baixos quanto 0,11. Em contraste aos procedimentos 
de Bonferroni e de Dunn-Sidak, o teste de Fisher sera vulneravel ao erro Tipo 
I se os testes nao forem verdadeiramente independentes. Com testes nao in¬ 
dependentes, e mais provavel que voce rejeite a H (l incorretamente, pois cada 
teste e contado como uma avalia^ao independente da probabilidade global, o 
que elas nao sao. 

Com certeza, e importante evitar o excesso de testes estatisticos que nao sao 
independentes uns dos outros. Por exemplo, voce nunca deve usar uma serie de 
testes -1 quando seus dados, na verdade, se ajustam a estrutura de uma ANOVA de 
um fator com um unico valor de P. Por essa mesma razao, preferimos contras- 
tes ortogonais a priori as compara^oes a posteriori, que envolvem muitos testes 
par-a-par que nao sao independentes uns dos outros. Como veremos no Capitulo 
12, a ANOVA multivariada (MANOVA) em geral e preferivel a uma serie de testes 
univariados quando todas as variaveis respostas sao altamente correlacionadas e 
medidas nas mesmas replicas. Similar a isso, a analise de componentes principals 
e as fun^oes discriminantes muitas vezes sao uteis para colapsar um conjunto de 
variaveis intercorrelacionadas em um numero menor de variaveis preditoras or¬ 
togonais (Capitulo 12). 

Mas uma vez que voce tenha reduzido as analises a um numero apropriado 
de testes, nossa preferencia e deixar os valores de P brutos e interpreta-los com 
algum bom senso. A maioria dos revisores e autores seria devidamente cetica a 
um unico valor de P significativo dentre um conjunto de 20 testes independen¬ 
tes, enquanto seis ou sete resultados significativos poderiam indicar que algu- 
ma coisa interessante esta acontecendo. Esperamos que voce possa convencer os 


‘ Estas diferentes linhas de argumentos tambem refletem a distiru^ao entre o P de Fisher e o a de 
Neyman-Pearson (Ver Nota de Rodape 19, Capitulo 4). 
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editores e revisores das revistas a deixar os valores de P brutos e prestar aten^ao 
em como voce os interpreta, em vez de constantemente desqualificar todo o seu 
trabalho em detrimento do uso dos ajustes de Bonferroni. 


RESUMO 


A analise de variancia e uma ferramenta estatistica poderosa com base na parti- 
<;ao algebrica da soma dos quadrados. Este metodo assume as amostras aleatorias 
independentes, as variancias homogeneas, a distribute do erro normal, a au- 
sencia de erros de classifica^ao e (para certos delineamentos) a aditividade dos 
efeitos principals. Se esses pressupostos forem cumpridos, as razoes-F dos termos 
de quadrados medios podem ser calculadas testando os efeitos aditivos ou de in- 
tera^ao dos diferentes tratamentos. A probabilidade de obter diferentes razoes-F 
pode ser usada para testar estatisticamente a hipotese nula de ausencia de efeito 
dos tratamentos. Do quadrado medio da ANOVA tambem pode ser feita a parti- 
<;ao da variancia nos dados em componentes distintos. Diferentes delineamentos 
experimentais, como o de blocos aleatorizados, de ANOVA aninhada, ANOVA 
multifatorial, de parcelas subdivididas e ANOVA de medidas repetidas, possuem 
suas proprias tabelas de ANOVA, nas quais diferentes quadrados medios sao uti- 
lizados para construir razoes-F apropriadas. A analise de covariancia (ANCOVA) 
e uma forma especial de ANOVA, que e um hibrido entre ANOVA e regressao. A 
constru^ao correta das razoes-F e sensivel a quando os tratamentos sao fatores 
fixos, em que ha apenas alguns niveis de tratamentos distintos, ou fatores aleato- 
rios, cujos niveis do tratamento sao um subconjunto aleatorio de uma popula^ao 
maior. E importante reconhecer qual delineamento de ANOVA se adequa ao seu 
delineamento amostral ou experimental. Como muitos delineamentos de ANO¬ 
VA tern um numero equivalente de fatores, e facil fazer uma analise incorreta, 
confiando nas configurates pre-estabelecidas dos programas estatisticos. Depois 
da ANOVA, as medias e as variancias dos tratamentos podem ser plotadas para 
revelar os padroes dos efeitos principals e as intera<;des entre os fatores. Testes a 
posteriori podem ser utilizados para fazer compara^oes par-a-par entre as dife¬ 
rentes medias, mas os contrastes a priori sao metodos mais poderosos para testar 
hipoteses e decompor os efeitos dos tratamentos em componentes distintos. As 
corre^oes de Bonferroni e outros metodos em geral podem ser usados para cor- 
rigir os valores de P em testes multiplos, mas bons argumentos podem ser feitos 
para que valores de P sejam interpretados sem nenhum ajuste. 



11 

Analise de Dados 
Categories 


M uitos estudos ecoldgicos e ambientais geram variaveis respostas que sao 
categoricas, em vez de continuas. Por exemplo, as plantas podem estar 
presentes ou ausentes em uma Area amoslrada, os besouros podem ser vermelhos, 
alaranjados ou pretos e os tigres forrageando podem virar com mais frequencia a 
direita do que a esquerda. De forma similar, as varidveis preditoras podem ser ca¬ 
tegoricas em vez de continuas. Por exemplo, grupos de tratamentos em um estudo 
experimental ou observacional representam diferentes categorias, como os tipos 
de esponjas e de raizes de mangues (ver Capitulo 10) ou diferentes esp^cies de 
besouros. Todos esses sao exemplos de variaveis categoricas. Os valores que uma 
varidvel categorica pode assumir sao chamados de niveis, podendo ser ordenados 
(p. ex., pouca luz, luz intermedidria, muita luz) ou desordenados (p. ex., besouros, 
moscas, vespas). 

Usamos regressao logistica (Capitulo 9) para analisar conjuntos de dados com 
varidveis preditoras continuas e variaveis resposta com dois niveis (p. ex., presen¬ 
te, ausente). Usamos ANOVA (Capitulo 10) para analisar conjuntos de dados com 
varidveis preditoras categoricas e varidveis respostas continuas. Entretanto, quan- 
do ambas as varidveis, preditora e resposta, sao categoricas, os dados resultam de 
um delineamento tabular (ver Capitulo 7) - e nem a ANOVA nem a regressao sao 
ferramentas analiticas apropriadas. 

Neste capitulo, damos enfoque a conjuntos de dados que possuem uma uni- 
ca varidvel resposta, com dois ou mais niveis (como a presen^a ou a ausencia de 
um organismo, ou a cor da pelagem de um animal). Os dados de estudos desse 
tipo representam contagens - ou frequences - de observances em cada categoria. 
Quando ha apenas uma unica variavel preditora categorica, os dados sao organi- 
zados em tabelas de contingencia de dois fatores, e as hipoteses sao testadas com 
teste de chi-quadrado, teste-G ou teste exato de Fisher (para o caso especial de ta¬ 
belas de contingencia 2 x 2). Quando hd muitas variaveis preditoras, os dados sao 
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organizados em tabelas de contingencia multifatoriais, que podem ser analisadas 
usando modelos log lineares ou arvores de classifica^ao. A analise bayesiana de 
tabelas de contingencia fornece estimativas probabilisticas da frequencia esperada 
para cada celula das tabelas de contingencia de dois fatores, ou para os parametros 
de modelos log lineares e arvores de classifica<;ao. A analise de muitas variaveis 
categoricas e discutida no Capitulo 12. 

Concluimos este capitulo com uma discussao de testes de bondade dos ajus- 
tes. Podemos testar quando a amostra de dados se conforma com, se tern consis¬ 
tency com, ou se ajusta a uma distribui^ao conhecida, como a binomial, Poisson 
ou normal. Os testes de bondade do ajuste - testes chi-quadrado,-G e de Kolmo- 
gorov-Smirnov - podem ser usados para verificar os residuos de dados brutos ou 
de dados transformados que seguem uma distribui^ao normal, um requerimento 
de muitos testes parametricos. 

TABELAS DE CONTINGENCIA DE DOIS FATORES 
Organizando os dados 

Os dados categoricos sao organizados tipicamente em tabelas de contingencia de 
dois fatores, nas quais as linhas representam os niveis da variavel preditora e as 
colunas, os da variavel resposta. Os registros nessas tabelas sao as contagens - ou 
frequences - de observances em cada categoria. Eis os dados fundamentals para 
a analise de tabelas de contingencia. 1 A analise de tabelas de contingencia e feita 
corretamente apenas sobre as contagens brutas, nao sobre porcentagens, proper¬ 
ties ou frequences relativas dos dados. 

Ilustramos testes de tabelas de contingencia de dois fatores usando dados de 
um estudo que examinam os fatores associados ao estado de 73 populates de 
especies de plantas raras da Nova Inglaterra (Farnsworth, 2004). Para cada po- 
pula^ao registrou-se se estava em declinio ou nao, se era legalmente protegida, a 
presen<;a ou ausencia de especies invasoras e cinco niveis qualitativos de lumino- 
sidade (de 0 para locais escuros ate 4 para os mais claros). As tres primeiras linhas 
desse conjunto de dados sao ilustradas na Tabela 11.1. Um resumo da associa^ao 
entre duas das variaveis categoricas desse conjunto de dados e apresentado na 
Tabela 11.2 em forma de tabela de contingencia. 

Essa tabela de contingencia ilustra a relat^ao entre o estado de prote<;ao das 
popula 9 oes de especies raras e quando ou nao as populates estavam em decli- 


1 A terminologia associada aos dados de tabelas de contingencia e um pouco inconsistente. Tecnica- 
mente falando, frequencias sao as contagens brutas de observances em cada celula da tabela de con¬ 
tingencia. As frequencias relativas sao proposes obtidas pela divisao do numero de observances 
de uma celula pelo total da linha, total da coluna ou pelo total geral da tabela. Por fim, as porcenta¬ 
gens sao propornoes que foram multiplicadas por 100, de forma que variam de 0 a 100. Porem, mui¬ 
tos cientistas usam o termo “frequencias” para indicar aquelas relativas e os termos “porcentagem” 
e “frequencias” indiferentemente. A distinnao entre esses termos e critica, entretanto, pois os testes 
estatisticos com dados em tabelas de contingencia precisam ser realizados com as contagens brutas 
(i. e., frequencias), nao com frequencias relativas ou propornoes. 
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TABELA 11.1 Tres linhas de um conjunto de dados com medidas de fatores 

associados com o estado populacional de especies de plantas raras 
na Nova Inglaterra 


Especies 

Especie invasora 
presente? 

Populanao em 
declinio? 

Protenao legal? 

Nivel de luz 

Aristolochia 

Nao 

Nao 

Nao 

2 

Hydrastis 

Nao 

Sim 

Nao 

0 

Liatris 

Sim 

Sim 

Nao 

4 


Cada observa^ao nesse estudo, e de uma popula^ao em particular de uma especie. Para cada popula<;ao, 
a tabela de dados registra a presen^a ou a ausencia de especies invasoras, se a popula^ao esta em declinio 
ou nao, se esta protegida legalmente ou nao, e do nlvel de luminosidade do sub-bosque, que varia de 0 
(menor luminosidade) a 4 (maior luminosidade). O tamanho amostral total e de 73 especies. (Dados de 
Farnsworth, 2004) 


nio. Nesta analise usaremos o estado de prote^ao como variavel preditora e o 
estado da popula^ao como variavel resposta. Estabelecemos assim o modelo por- 
que acreditamos que o de prote«;ao afeta potencialmente o estado da popula^ao, 
e nao o contrario. Note, contudo, que, ao montar uma tabela de contingencia, 
nao importa se voce coloca os preditores em linhas e respostas em colunas, ou 
vice-versa. Os testes estatisticos aplicados a tabelas de contingencia dao o mesmo 


TABELA 11.2 Tabela de contingencia de dois fatores resumindo a rela^ao entre a 
prote<;ao e o estado da popula«;ao 


Estado da populanao 

Estado de prote^ao 

Sem prote^ao Protegida 

Total da linha 

Em declinio 

ili = 18 

Yl,2 = 8 

m 

;=i 

Estavel ou aumentando 

II 

Y 2,2 = 32 

t^ 

ii 

Total da coluna 

In .= 33 

i= 1 

O 

II 

<N 

CO 

II 


Cada celula na tabela especifica uma combina^ao particular de protenao e estado da popula^ao. Os nume- 
ros indicam quantas populates foram observadas dentro de uma classifica^ao em particular. Por exemplo, 
existem 18 populates desprotegidas que estao em declinio e 32 protegidas que estao estaveis ou aumen- 
tando. Algumas tabelas de contingencia podem ter valores de 0 quando nao houver observances para uma 
combina^ao particular de fatores. Em qualquer tabela de contingencia de dois fatores, a celula com o valor 
do total geral (73) e igual a do total das linhas (26 + 47), que tambem e igual a soma do total das colunas 
(33 + 40). As somas das colunas e das linhas as vezes sao chamadas de total marginal dos dados. (Dados de 
Farnsworth, 2004) 
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resultado de qualquer jeito. Interpretar as relates de causa e efeito a partir dos 
resultados desses testes, contudo, requer a distin^ao entre preditores e respostas. 

As tabelas de contingencia de dois fatores possuem linhas e colunas. Por con- 
ven<;ao, as linhas sao indexadas usando a letra i e as colunas, j. Os indices das 
linhas variam de 1 a n, onde n e o numero de categorias nas linhas (duas na Tabela 
11.2). Os indices das colunas variam de 1 a m, onde me o numero de categorias 
das linhas (duas na Tabela 11.2). O valor T (/ em cada celula representa a frequen- 
cia do numero de observa^oes que estao tanto no nivel representado na linha 
quanto no nivel representado na coluna. Por exemplo, o valor 18 na celula supe¬ 
rior esquerda (3T U ) da Tabela 11.2 significa que 18 populates foram amostradas 
e estavam em declinio e desprotegidas. 2 

As outras quantidades que sao derivadas de tabelas de contingencia corres- 
pondem ao total das linhas, ao total das colunas e ao total geral. O total das 
linhas e a soma das observances em cada linha (na Tabela 11.2, ha um total de 
26 populanoes em declinio e 47 estaveis ou aumentando). O total das colunas e a 
soma das observances em cada coluna (na Tabela 11.2, ha um total de 33 popu- 
lanoes que estao desprotegidas e 40 que tern certo grau de protenao legal). O total 
geral (que e igual ao tamanho amostral total) pode ser calculado de tres formas: 
como a soma do total das linhas (26 + 47 = 73), a soma do total das colunas (33 
+ 40 = 73) ou a soma das frequences em cada celula (18 + 8 -I- 15 + 32 = 73). Se 
todas essas somas nao forem iguais, confira sua aritmetica! 

Uma forma conveniente de visualizar os dados em tabelas de contingencia e 
por meio de um grafico mosaico (Friendly, 1994). A Figura 11.1 ilustra um grafi- 
co mosaico dos dados mostrados na Tabela 11.2. Nesse grafico, os dois “eixos” sao 
as duas variaveis - estado de protenao no eixo-x (a variavel preditora) e estado da 
populanao no eixo-y (a variavel resposta). O tamanho dos “retangulos” e dimen- 
sionado na propornao de observances em cada celula da tabela de contingencia. 
Portanto, a area total de cada retangulo e proporcional a frequencia relativa das 
combinanoes. 

As variaveis sao independentes 

Especificando a hipotese nula As tabelas de contingencia sao usadas para tes- 
tar a hipotese nula de que as variaveis preditora e resposta nao sao associadas 
uma com a outra. No exemplo mostrado na Tabela 11.2, a questao e se ha uma 
associanao ou relanao entre o estado de protenao da populanao e se ela esta ou 


2 Infelizmente, nao existem metodos padrao para organizar tabelas de contingencia em planilhas, 
nem formas padronizadas com as quais os programas estatisticos manipulem dados categoricos. 
Alguns programas importam tabelas de contingencia diretamente, outros geram essas tabelas a 
partir de conjuntos de dados em que cada linha representa uma unica observa^ao, e ainda ha os 
que trabalham dados em ambos os formatos. Se voce tiver um pacote estatistico favorito e souber 
que trabalhara com dados categoricos, confira os requerimentos de formato antes de come^ar a 
codificar seus dados. 
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Desprotegidas 


Protegidas 
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Estado de protegao 


Figura 11.1 llustraqao de um grafico mosaico. Esse grafico retrata a rela^ao entre o estado 
das populates de plantas raras e quando as terras em que elas ocorrem sao protegidas ou nao 
(Farnsworth, 2004). As frequences nas celulas (da Tabela 11.2) sao representadas como"retangu- 
los", cujos tamanhos sao proporcionais a frequencia relativa no conjunto de dados. A largura das 
colunas e proporcional ao total das colunas. Por exemplo, como 40 das 73 populates sao protegi¬ 
das, a coluna da prote^ao ocupa 55% (ou 40/73) da largura do grafico. A altura de cada retangulo e 
proporcional a frequencia da celula. Deste modo, 32 das 40 populates protegidas estao estaveis 
ou aumentando, portanto seu retangulo ocupa 32/40, ou 80%, da coluna da direita. 


nao em declinio. Especificamente, precisamos saber se populates desprotegidas 
sao mais provaveis de estarem em declinio do que as protegidas. Se esse padrao 
puder ser estabelecido, ele pode sugerir que a prote^ao tern um efeito mensura- 
vel na preven^ao do declinio das populates. Para testar essa hipotese cientifica, 
primeiro precisamos especificar uma hipotese nula estatistica apropriada. Nesse 
caso, a mais simples e que as duas variaveis sao independentes uma da outra e 
que o grau de associa^ao observado nao e mais forte que o esperado por chance 
ou amostragem randomica. Nossa discussao no Capitulo 2, sobre a probabili- 
dade de eventos independentes, nos deu uma estrutura de trabalho para testar 
esta hipotese nula. 

Calculando os valores esperados Nossa hipotese nula diz que os valores em 
cada uma das quatro celulas na Tabela 11.2 sao independentes uns dos outros. 
Perguntamos, portanto: quais seriam os valores esperados em cada uma das 
quatro celulas se a estabilidade da popula^ao e seu estado de prote<;ao forem 
independentes um do outro? Como um exemplo, pegue a celula superior da 
esquerda, com o numero de populates que estao em declinio e nao sao prote¬ 
gidas. Qual e o numero esperado de populates nesta categoria sob a hipotese 
nula de independence? O valor esperado e o numero total de observances (N) 
vezes a probabilidade (P) de uma popula^ao ser desprotegida e estiver em de- 
clinio: 
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t m deciinio,des P me g ida = NxP(em declitiio n desprotegida) (11.1) 


Relembre que, no Capitulo 1, o simbolo de interse^ao n significa a ocorrencia 
simultanea de dois eventos, A e B. Tambem, a partir do Capitulo 1 (Equa^ao 1.3), 
sabemos que a probabilidade de dois eventos independentes ocorrerem ao mes- 
mo tempo e igual ao produto de suas probabilidades individuals: 

P (em deciinio n desprotegida) = P (em deciinio) x P (desprotegida) (11.2) 

Como nao temos mais nenhuma informa^ao acerca dessas duas populates 
que nao os dados por si so, estimamos as probabilidades de cada um dos termos a 
direita, na Equa^ao 11.2, a partir dos totais marginais da Tabela 11.2. Por exemplo, 
estimamos a probabilidade de uma popula^ao estar em deciinio como o numero 
total de populates em deciinio (26 = o total da primeira linha) dividido pelo 
numero total de populates (73). Essa probabilidade e = 0,356. De forma similar, 
estimamos a probabilidade de desprote^ao de uma popula<;ao usando o total da 
primeira coluna (33 = total de populates desprotegidas) dividido pelo numero 
total de populates (73). Essa probabilidade e = 0,452. Substituindo esses valores 
na Equaqio 11.1, temos: 


Yem deciinio, desprotegida — 73x0,356x0,452— 11,75 (11.3) 


Desta forma, se os estados “prote^ao” e “deciinio” forem independentes um 
do outro, esperariamos que aproximadamente 12 das 73 populates amostradas 
estivessem desprotegidas e em deciinio. 

A forma geral para calcular o valor esperado de uma celula em uma tabela de 
contingencia de dois fatores com i = 1 a n linhas ej = 1 a m colunas e: 



tota[ da linhas x toted das colunas 

tamanho amostral 


liyxX y,.j 

H »=i 

N 


(11.4) 


Aplicando a Equa^ao 11.4 a cada uma das celulas em nosso exemplo (Ta¬ 
bela 11.2), obtemos os valores esperados para cada celula (Tabela 11.3). Como 
usamos os dados para gerar essas probabilidades, o total das linhas, o total das 
colunas e o total geral dos valores esperados sempre serao identicos aos totais 
observados. 

Teste de hipoteses: teste de chi-quadrado de Pearson 

O teste de chi-quadrado e o metodo-padrao para testar a hipotese de que as varia- 
veis em uma tabela de contingencia de dois fatores sao independentes. 
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TABELA 11.3 Valores esperados para os dados da Tabela 11.2 


Estado da popula^ao 

Estado de prote^ao 

Sem prote^ao Protegida 

Total da linha 

Em decllnio 

11,75 

14,25 

26 

Estavel ou aumentando 

21,25 

25,75 

47 

Total da coluna 

33 

40 

Total geral = 73 


A partir da Tabela 11.2, esses valores esperados resumem a rela^ao entre o estado das populates de plantas 
raras e se elas estao em terras protegidas ou nao. Os valores esperados sao calculados sob a hipotese nula de 
que nao ha uma associa^ao entre o estado de prote^ao e o da popula^ao. Se os dois fatores sao independen- 
tes, entao a frequencia esperada em cada celula e apenas o total das linhas vezes o total das colunas, dividido 
pelo total geral (Equa^ao 11.4). Note que a soma dos valores esperados produz os mesmos totais de linhas 
e colunas dos dados originais (Tabela 11.2). (Dados de Farnsworth, 2004) 


A estatIstica-teste A estatistica-teste, chamada de estatistica chi-quadrado de 
Pearson (Pearson, 1900), 3 e calculada como: 


X 


Pearson 


= i 

to das celulas 


{Observado - Esperado) 2 


Esperado 


(11.5) 


Em outras palavras, para cada celula, subtraimos o valor esperado do que foi 
observado, elevamos esta diferer^a ao quadrado e dividimos pelo valor esperado. 
Por fim, somamos esses quocientes. Para os dados na Tabela 11.2 e para os valores 
esperados na Tabela 11.3, temos: 


X 


2 

Pearson 


(18 — 11,75) 2 
11,75 


(8 —14,25) 2 (15-21,25) 2 (32-25,75) 2 

14,25 21,25 25,75 


= 3,32 + 2,74 + 1,83 + 1,52 


= 9,42 


'Karl Pearson (1857-1936) foi um dos fundadores da estatistica moderna. 

\ Apos se graduar na Cambridge University, em 1879, ele mudou-se para a Uni- 

versity College, Londres, onde, em 1911, e foi nomeado “Galton Professor” 
de Eugenia. Alem do desenvolvimento do teste de chi-quadrado, ele criou o 
termo “desvio-padrao” para descrever a \ a 2 , inventou o coeficiente de corre- 
la^ao (r), fez significativos avan^os na analise de regressao e foi co-fundador 
da revista Biometrika , que publica contribuicoes estatisticas com aplica^oes 
biologicas. Pearson foi particularmente interessado em estatistica de amostras 
Karl Pearson grandes (assintotica). Ele discordou de Fisher sobre a importancia relativa da 

estatistica de amostras grandes versus amostras pequenas. Tal discordancia foi 
significativa o suficiente para Fisher rejeitar uma oferta de emprego de estatistico-chefe do Galton 
Laboratory for National Eugenics , que foi coordenado por Pearson. 
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Intuitivamente, voce pode ver que a estatistica chi-quadrado mede a exten- 
sao na qual as frequencias observadas diferem das esperadas, sob a hipotese nula 
de independence. Suponha que as frequencias observadas em cada celula sejam 
exatamente iguais as esperadas. O valor do chi-quadrado seria igual a 0. Quanto 
mais os valores observados se desviam das frequencias esperadas, maior o valor 
do chi-quadrado. Ainda, note que a estatistica do chi-quadrado e uma medida 
elevada ao quadrado, portanto somente importa o valor do desvio, e nao se ele e 
negativo ou positivo. Neste sentido, a estatistica chi-quadrado e bastante similar 
a soma dos quadrados dos residuos que descrevemos para a regressao linear 
(Capitulo 9). 

A distribui^ao esperada da estatistica chi-quadrado de Pearson e a distribui- 
<pio chi-quadrado (% 2 ). 4 Como a distribui<;ao-F (Capitulos 5 e 10) e a distribui- 
<;ao-f (Capitulo 3), a forma da distribui^ao chi-quadrado varia com o numero de 
graus de liberdade. 

Graus de liberdade Quais sao os graus de liberdade para a Tabela 11 .2? Para um 
dado tamanho amostral (73 neste caso) e para os dois totais das linhas (26 e 47 
neste caso) e para os dois totais das colunas (33 e 40), assim que o valor de uma 
celula seja especificado, todos os outros sao fixos. Desta forma, ha apenas um grau 
de liberdade nesta tabela 2x2. 

Se a tabela de contingencia tiver mais de duas colunas, todos os valores de 
cada linha podem variar, menos um (uma vez que todos tenham sido especifi- 
cados, menos um, o valor desse ultimo sera determinado pelo total da linha). 
De forma similar, se a tabela de contingencia tiver mais de duas linhas, todas 
menos os valores de cada coluna podem variar, menos um. Em geral, o numero 
de graus de liberdade de uma tabela de contingencia, indicado pela letra grega 
V, e igual a: 

df = V =(numero de linhas - 1) x (numero de colunas - 1) (11.6) 


4 A distribui^ao chi-quadrado (j£ 2 ) e uma fun^ao densidade de probabilidade que assume valores de : 
a +°o. Sua fun^ao densidade de probabilidade, avaliada apenas para valores positivos de x, e: 


1 - 


/(*)= 


r,f> 


onde r(x) e a fun^ao Gamma (ver Capitulo 5, Nota de rodape 11) e v e o numero de graus de liberda¬ 
de. De fato, uma distribui^ao % com V graus de liberdade e identica a distribui^ao Gamma avaliada 
com a = v/2 eb = 1/2. A distribui<;ao yj tern apenas um parametro, v. Seu valor esperado = v, e sua 
variancia esperada = 2v. A distribui^ao-F usada em ANOVA (Capitulos 5 e 10) tambem pode ser 
expressa como a razao de duas distributes X . 
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Esse calculo dos graus de liberdade difere de nossa experiencia com ANOVA 
(Capitulo 10) e regressao (Capitulo 9). Naquelas analises, os graus de liberdade 
dependiam, em parte, do tamanho amostral total. Mas, na analise de tabelas de 
contingencia, os graus de liberdade dependem apenas do numero de categorias, 
ou de celulas, na tabela. Assim, na Tabela 11.2, se tivessemos dados sobre 730 
populates em vez de 73, o teste de chi-quadrado ainda teria apenas 1 grau de li¬ 
berdade, pois estariamos analisando uma tabela 2x2. Contudo, o teste estatistico 
seria muito mais preciso com 730 populates do que com apenas 73. Este ganho 
em precisao seria perdido se os dados fossem transformados em propor<;ao ou 
porcentagens, que e uma razao da analise de dados categoricos a ser feita com as 
frequencias brutas. 

Calculando o valor de p Como em todos os testes de hipoteses, estamos interes- 
sados em encontrar a probabilidade dos dados, dada a hipotese nula [P(dados|H 0 )], 
onde a hipotese nula e que as variaveis sao independentes. O valor de P e a proba¬ 
bilidade de cauda em obter nossos dados ou dados ainda mais extremos, dada a 
hipotese nula (ver Capitulo 4). Para o teste de chi-quadrado de Pearson aplicado a 
Tabela 11.2, encontramos a probabilidade de obter um valor de X 2 Pearson tao grande 
ou maior que 9.42 (pela Equa^ao 11.5) em rela^o a distribui^ao yj com 1 grau de 
liberdade (pela Equa^ao 11.6). Esse valor pode ser encontrado em uma tabela (p. 
ex., Rohlf & Sokal, 1995), mas provavelmente ele sera fornecido por um programa 
de estatistica. A probabilidade de obter esse valor de p ear son = 0,0022. Por ser mui¬ 
to menor que o valor critico padrao (= probabilidade de cometer um erro Tipo I) 
de 0,05, rejeitamos a hipotese nula de que as duas variaveis, o estado da popula<;ao 
e o estado de prote^ao sao independentes. 

Como enfatizamos no Capitulo 4, o valor de P e usado para decidir sobre re- 
jeitar ou nao a hipotese nula. O proximo passo e examinar um grafico dos dados 
e decidir se o padrao estatistico suporta ou contradiz a hipotese cientifica. Neste 
caso, a hipotese cientifica e de que o estado de prote<;ao garante a estabilidade da 
popula^ao, e, de fato, este e o padrao observado na Figura 11.1: das 40 populates 
protegidas, 80% (=32) eram estaveis ou estavam aumentando. Em contraste, das 
33 populates desprotegidas, apenas 45% (= 15) eram estaveis ou estavam au¬ 
mentando. A probabilidade do teste de chi-quadrado afirma que essa diferen^a e 
improvavel de ter ocorrido por chance (P = 0,0022), e concluimos, a partir dessa 
simples analise, que o estado de prote<;ao e associado a estabilidade da popula<;ao. 

A estatistica do chi-quadrado e o mais familiar e basico teste da independen- 
cia em uma tabela de contingencia. Agora exploraremos duas alternativas para o 
teste de chi-quadrado: o teste-G e o Teste Exato de Fisher. 

Uma alternativa ao teste de chi-quadrado de Pearson: o teste-G 

Como o teste de chi-quadrado, o teste-G de independencia tambem compara as 
frequencias observadas com as esperadas. Ele pergunta quao bem a distribui^ao 
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dos valores observados se compara a dos valores esperados com base na distribui- 
$ao de probabilidades multinomial. 

A estatistica-teste A estatistica-teste e a razao da probabilidade das fre¬ 
quences observadas com a probabilidade das esperadas (portanto, o teste-G 
muitas vezes e chamado de teste de razao de verossimilhan^as). Essa razao 
pode ser calculada de duas formas. A primeira forma, e mais simples, usa os 
valores esperados que foram calculados com a Equa<;ao 11.4 e ilustrados na 
Tabela 11.3: 


G = 2 


X I 

todas celulas 


Observado X In 


Observado 

Esperado 


(11.7) 


Alternativamente, o G pode ser calculado diretamente das frequencias obser¬ 
vadas, sem ter que primeiro calcular os valores esperados: 


A distribui^ao multinomial e uma extensao simples da distribui^ao binomial (Capitulo 2, Equates 
2.2 e 2.3) para variaveis que podem assumir mais de dois valores. Para uma variavel aleatoria 7 que 
pode assumir j valores, 7=17!,..., 7 ; ], cada um com probabilidade p- onde pelo primeiro axioma de 
probabilidade, 

Ip ,=1 

1=1 

e para N tentativas: 


I Yi = N 


a distribui^ao binomial e definida como: 


W„~»)).N!ri£ 

1=1 

Para os dados da Tabela 11.2, usando esta formula, a probabilidade de observar a frequencia das 
quatro celulas Y I V Y x v 7 21 e 7 2 2 (que sao iguais a 18,8,15 e 32, respectivamente) e: 


N\ 


! x ^1,2! x Y 2l ! x 7 2 2 ! 


-x 


(y \ 
x 1,1 

> 1,1 

X 

(Y } 

J l ,2 

M .2 

X 

(v \ 
r 2,1 

^ 2,1 

X 

(y \ 
r 2.2 

[n J 


L*J 


In) 


In) 


r 2,2 

= 0,00202 


Compare este resultado aquele dado no texto para o teste-G. 
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/ 


Em palavras, a Equa^ao 11.8 nos instrui a tomar a soma do produto da fre¬ 
quencia de cada celula vezes seu logaritmo natural, subtrair da soma do produ¬ 
to do total das linhas vezes seu logaritmo natural, subtrair da soma do produto 
do total das colunas vezes seu logaritmo natural e, entao, somar o produto do 
total geral por seu logaritmo natural. Por fim, multiplique tudo por dois. A 
Equa<;ao 11.8 e particularmente util quando ha um grande numero de celulas e 
e um problema calcular todos os valores esperados. As Equates 11.7 e 11.8 sao 
algebricamente equivalentes, e ambas geram um valor G de 9,575 para os dados 
na Tabela 11.2. 

Graus de liberdade Os graus de liberdade do teste-G sao os mesmos para o de 
chi-quadrado de Pearson, e igual ao produto do (numero de linhas - 1) por (nu¬ 
mero de colunas - 1) (Equa<;ao 11.6). Para os dados na Tabela 11.2, ha apenas um 
grau de liberdade. 

Calculando o valor de p Como na estatistica chi-quadrado de Pearson, a esta- 
tistica-G e distribuida como uma variavel aleatoria % 2 com v graus de liberdade. 
O valor de P para G = 9,575 com 1 grau de liberdade e 0,00197 (dentro do erro de 
arredondamento do calculo na Nota de rodape 5). 


0 teste de chi-quadrado e o teste-G para tabelas LxC 

O teste de chi-quadrado e o teste-G nao sao restritos a simples tabelas 2x2, como 
a Tabela 11.2. Eles podem ser usados para qualquer tabela de contingencia de dois 
fatores, independentemente do numero de niveis ou de categorias de cada varia¬ 
vel. Tais tabelas com frequencia sao chamadas de tabelas LxC, pois podem ter um 
numero arbitrario de Linhas e Colunas. A Tabela 11.4 apresenta outro subconjun- 
to dos dados de Farnsworth (2004) como uma tabela 2 x 5 - a rela^ao entre estado 
da popula<;ao (duas categorias) e nivel de luminosidade (cinco categorias). Para 
esses dados, a estatistica % 2 = 2,83 e tern 4 graus de liberdade [(5-1 colunas) x (2 
- 1 linhas)], o valor de P = 0,59. Esse valor e bem maior que 0,05 motivo pelo qual 
nao podemos rejeitar a hipotese nula de que essas variaveis sao independentes. 
De forma similar, a estatistica-G = 3,41, possui 4 graus de liberdade e valor de P 
= 0,49, o que tambem causa a rejei^ao da hipotese nula de independencia. Ambas 
as analises sugerem que o nivel de luminosidade de um local nao afeta se uma po- 
pula^ao esta estavel ou em declinio. Embora os dados de frequencia teoricamente 
possam ser ajustados a tabelas LxC de qualquer tamanho, quanto mais categorias 
houver na tabela, maior devera ser o tamanho amostral para que o teste funcione 
de maneira adequada. 
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TABELA 11.4 Valores observados (em negrito) e esperados (entre parenteses) usados para 
testar a independencia entre o estado da popula^ao e o nivel de luminosidade 


Estado da popula^ao 

0 

Estado de prote^ao 

1 2 3 

4 

Total da linha 

Em declinio 

5 (3,2) 

0(0,7) 

3 (3,6) 

12(12,5) 

6 (6,0) 

26 

Estavel ou aumentando 

4(5,8) 

2(1,3) 

7 (6,4) 

23 (22,5) 

11(11,0) 

47 

Total da coluna 

9 

2 

10 

35 

17 

Total geral = 73 


Nesta tabela de dois fatores, a associate) entre o nivel de luminosidade e o estado da popula^ao e ilustrado para 73 po¬ 
pulates de plantas monitoradas (Tabela 11.1). Os locais foram classificados de acordo com 5 niveis de luminosidade (0 
= mais baixa, 4 = mais alta). Embora existam 10 celulas na tabela, ela ainda e considerada uma tabela de contingencia 
de dois fatores (nivel de luminosidade e estado da popula^ao). Como na tabela de dois fatores mais simples, os totais 
marginais e o total geral dos valores observados sao iguais aos totais marginais e ao total geral dos valores esperados. Os 
valores esperados foram calculados sob a hipotese nula de nenhuma associa<;ao entre o nivel de luminosidade e o estado 
da popula<;ao. (Dados de Farnsworth, 2004.) 


CORREQDES PARA PEQUENOS TAMANHOS AMOSTRAIS E PEQUENOS VALORES ESPE¬ 
RADOS Quando o tamanho amostral total e grande (Legendre & Legendre 
[1998] consideram “grande” como sendo 10 vezes maior que o numero de ce¬ 
lulas na tabela de contingencia), tanto a distribui^ao da estatistica chi-quadra- 
do de Pearson quanto a G sao igualmente proximas de uma variavel aleatoria 
Contudo, quando o tamanho amostral total e pequeno - menos de cinco 
vezes o numero de celulas podem haver muitos valores observados iguais a 
zero ou muitos valores esperados baixos. Os valores esperados baixos consti- 
tuem um problema em potencial, pois sao usados no denominador da estatis¬ 
tica chi-quadrado (Equa^ao 11.5). Portanto, se o valor esperado em uma celula 
for muito pequeno, mesmo um desvio modesto no valor observado pode au- 
mentar muito o valor da estatistica chi-quadrado geral. Quando o tamanho 
amostral e pequeno, a estatistica-G deve ser ajustada por meio de um metodo 
proposto por Williams (1976): 



^ajustado ^^min 

(11.9) 

onde: 
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Na Equa^ao 11.10, m e o numero de colunas, n e o de linhas, N e o tamanho 
amostral total e v sao os graus de liberdade. Como anteriormente, Y i} representa 
a frequencia de observances na (linha i, coluna j ) da tabela de contingencia. O 
primeiro termo do numerador e 1 menos o tamanho amostral total multiplicado 
pela soma dos inversos dos totais das colunas. O segundo termo e 1 menos o ta¬ 
manho amostral total multiplicado pela soma dos inversos dos totais das linhas. 
Para a Tabela 11.4, 


[73x (— + — + — + — + —) — 1] x [73 x (— + —) -1] 

_ 1 _l_ 9 2 10 35 17 _ 26 47 __^ | Qg 

6x4x73 


e a estatistica-G ajustada = 3,41/1.109 = 3,072, que tern um valor de P de 0,55. 
Note que a estatistica-G ajustada e mais conservativa (gera valores de P maiores) 
que a G sem ajuste (P = 0,49). 

Os livros-padrao de estatistica (p. ex., Sokal & Rohlf, 1995) recomendam o uso 
do G a - ustado sempre que qualquer valor esperado for inferior a 5, e alguns programas 
de estatistica produzem mensagens de alerta sobre a validade do chi-quadrado 
ou teste-G quando os valores esperados sao pequenos. Por outro lado, Fienberg 
(1980) mostrou, em um estudo de simulates, que a corre^ao nao e necessaria 
enquanto todos os valores esperados forem maiores que 1. Na pratica, contudo, 
o uso do G a - ustado vs. o G apenas faz diferen^a quando o tamanho amostral for 
pequeno e os valores de P estiverem proximos de 0,05. Apesar das mensagens de 
aviso, a maioria dos pacotes estatisticos nao incorpora o G ajustado em seus menus de 
opnoes, embora muitos incluam outra corre<;ao, em que 0,5 e somado ou subtrai- 
do de cada valor observado na tabela. Essa corre<;ao, conhecida como corre^ao de 
continuidade de Yates (Sokal 8c Rohlf, 1995) tambem resulta em valores menores 
de G ou X 2 Pcarson , levando, como o G ajustado , a um teste mais conservative (i. e., um 
teste menos provavel de rejeitar a hipotese nula). 


Valores assintOticos versus testes exatos O teste de chi-quadrado de Pear¬ 
son e o teste-G sao assintoticos - ou seja, a distribui^ao do G e a do -Y 2 Pearson se 
aproximam de uma variavel aleatoria % 2 conforme o tamanho amostral se torna 
infinitamente grande. Portanto, os valores de P calculados tern como base uma 
aproximanao, embora razoavel. Por meio de um pressuposto-chave, contudo, e 
possivel calcular um valor de P exato para uma tabela de contingencia Lx C. 
Esse pressuposto e de que os totais das linhas e das colunas sao fixados a priori 
pelo pesquisador. 


Por exemplo, Na Tabela 11.2, um teste exato seria apropriado se a inten<;ao 
do estudo fosse a de amostrar exatamente 26 populates em declinio, 47 esta- 
veis ou aumentando, 33 desprotegidas e 40 protegidas. Embora esse pressupos¬ 
to seja improvavel nesse exemplo, nao e dificil imaginar experimentos nos quais 
o numero de individuos em cada grupo de tratamento seja fixo e a intensidade 
do tratamento aplicado aos individuos tambem. Mais tipicamente, em estudos 
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amostrais, ou o total das linhas ou o das colunas e fixado pelo investigador, mas 
nao ambos. Assim, podiamos ter escolhido amostrar 33 populates desprotegidas 
e 40 protegidas, mas nao ter colocado restri<;6es sobre o estado da popula^ao. Ou, 
poderiamos ter selecionado 26 populates em declinio e 47 estaveis, sem conside- 
rar seu estado de prote^ao. 

Quando os totais das linhas e das colunas sao fixados, o calculo de um va¬ 
lor de P exato e, do ponto de vista conceitual, simples, mas, do computacional 
intensivo. A probabilidade exata (ou valor de P) e a de obter a frequencia obser- 
vada nas celulas e todas as outras frequences daquelas que sao mais extremas 
que os valores esperados, dado o valor fixo para o total das linhas e das colunas. 
Para uma tabela 2x2, este procedimento e chamado de Teste Exato de Fisher. 
Como antes, a hipotese nula e de que as variaveis das linhas e das colunas sao 
independentes. 

Primeiro, calculamos o numero total de permuta^oes (ver Capltulo 2) que 
podem resultar de uma tabela 2x2 com os totais de linha e colunas fixos. Este 
valor e: 


N 

Yu+Yii 


V 


2 ) 


N 

Y u +Y u 


Nl 


•x- 


Nl 


(Y U1 +Y U )\(Y U+ Y 2}2 )\ (Y u +y 2J )!(y u +y 2>2 )! 

(ii.il) 


Segundo, a partir da distribui^ao multinomial (ver Nota de rodape 5, neste 
capitulo), calculamos o numero de formas nas quais podemos obter a exata com- 
bina<;ao de valores das celulas que observamos: 


Nl 


Y u \xY u2 \xY 2 ,lxY u \ 


( 11 . 12 ) 


A divisao da Equa^ao 11.12 pela Equa^ao 11.11 resulta na probabilidade da 
combina^ao precisa dos valores das celulas que observamos (equivalente ao cal¬ 
culo do numero de sucessos dividido pelo numero de tentativas): 



A probabilidade de cauda e igual a Equa^ao 11.13 mais as probabilidades de 
todos os casos mais extremos. Para uma tabela 2 x 2, a probabilidade em cauda e 
calculada apenas com a enumera^ao de todos os casos mais extremos, reaplicando 
a Equa^ao 11.13 a cada caso, e somando os resultados. Note que os totais margi¬ 
nal (os valores do numerador) e o total geral (o valor do N no denominador) 
permanecem os mesmos em todos os casos extremos (apenas os valores Y ( ( indivi- 
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duais no denominador da Equa^ao 11.13 mudam nos outros casos). O valor exato 
de P e a soma de todas as intera 9 oes da Equa^ao 11.13; para a Tabela 11.2, o valor 
exato de P = 0,0031. Para a tabela de contingencia 2x5, ilustrada na Tabela 11.4, 
o valor exato de P = 0,60. 

Qual teste escolher? 

Todas estas tres alternativas - o teste assintotico de chi-quadrado de Pearson, o 
teste-G assintotico e seus testes-exatos em contrapartida - dao resultados um 
pouco diferentes, especialmente para tamanhos amostrais pequenos. Uma for¬ 
ma comum, porem equivocada, de escolher qual usar e executar as tres op<;oes e 
ficar com a que der o melhor resultado - o menor valor de P. Uma forma mais 
apropriada de escolher e adequar o delineamento amostral do estudo aos pres- 
supostos do teste. 

Tres delineamentos diferentes podem gerar tabelas de contingencia identicas, 
e cada um deles tern um teste associado. Primeiro, nosso estudo poderia ter sido 
definido pelo tamanho amostral total (73, no caso da Tabela 11.2), sem nenhu- 
ma atribui^ao a priori do numero de populates (ou individuos) a cada catego- 
ria. Esse e o pressuposto mais comum em estudos de campo: escolha o tamanho 
amostral total e deixe as partes cairem onde podem. Sokal & Rohlf (1995) se refe- 
rem a isto como delineamento Modelo I. 

Em um delineamento Modelo II, ou o total das linhas ou o total das colu- 
nas, nunca ambos, podera ser fixado por antecipa^ao. No estudo de Farnsworth 
(2004), o numero de popula 9 oes protegidas foi fixado em 40 por antecipa 9 ao e o 
de desprotegidas, em 33 (talvez por causa de decisoes regulatorias feitas com ante- 
cedencia), mas a fra 9 &o de popula 9 oes em declinio podia variar livremente. 

Por fim, se o investigador fixar a priori tanto o total das linhas quanto o total 
das colunas, temos um delineamento Modelo III. Os delineamentos Modelo II e 
Modelo III sao mais provaveis em estudos experimentais, enquanto o Modelo I e 
mais comum em estudos observacionais. 

O teste-G foi desenvolvido explicitamente para delineamentos Modelo I (ta¬ 
manho amostral fixo), mas ele pode ser usado tanto para delineamentos de Mo- 
delos I como para Modelos II (total de linhas ou colunas fixo). O teste de chi-qua¬ 
drado de Pearson nao foi desenvolvido com nenhum delineamento em mente: 
conforme o tamanho da amostra seja grande, ele dara resultados virtualmente 
identicos ao teste-G. Quando o tamanho amostral no Modelo I ou no Modelo II 
for pequeno, o teste-G com a corre 9 ao de William ou de Yates sera apropriado. Os 
testes exatos sao, na verdade, apropriados apenas para os delineamentos Modelo 
III (tanto o total das linhas quanto o das colunas e fixo). 

Por fim, existem simula 9 oes de Monte Carlo ou de computador analogas para 
cada um dos tres delineamentos. Em uma simula 9 ao de Monte Carlo, nao usamos 
uma distribu^ao estatlstica para determinar os valores de P, mas, em vez disso, os 
estimamos diretamente da amostragem (ver Capitulo 5). Por exemplo, uma simu- 
la 9 ao de Monte Carlo para um delineamento Modelo I atribui randomicamente 
as 73 popula 9 oes a cada uma das 4 celulas da Tabela 11.2. Contudo, a probabili- 
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dade de cair em cada uma daquelas celulas e proporcional ao valor esperado de 
cada uma (Equa^ao 11.4). Desta forma, os totais marginais dos dados simulados 
serao, em media, os mesmos que os valores dos totais marginais observados. Para 
cada conjunto de dados simulados, a estatistica chi-quadrado padrao sera calcula- 
da. Mil (ou um numero maior) valores simulados serao criados e compararemos 
o valor de chi-quadrado observado diretamente com a distribui^ao de valores 
simulados. Portanto, a probabilidade de cauda estimada pela analise de Monte 
Carlo e 0,010, qualitativamente similar, embora nao seja identica aos resultados 
dos testes-G e de chi-quadrado. 

TABELAS DE CONTINGENCY MULTIFATORIAIS 

A maioria dos dados ecologicos inclui mais de duas variaveis (Tabela 11.1). Por¬ 
tanto, com frequencia testamos a independencia entre multiplas variaveis predi- 
toras. Como com as tabelas de contingencia de dois fatores, os dados sao melhor 
digitados em planilhas (Tabela 11.1), mas melhor organizados como tabelas de 
contingencia (Tabela 11.5). 

Organizando os dados 

Uma vez que temos mais de dois fatores, os dados sao organizados em tabelas de 
contingencia multidimensionais que nao podem ser visualizadas tao facilmente 
como as bidimensionais. Uma forma de mostrar dados categoricos multidimen¬ 
sionais e com multiplas tabelas de dois fatores, uma para cada nivel dos fato- 


TABELA 11.5 Classifica^ao completa dos dados de 73 populates de especies de 
plantas raras 


Especie invasora 

Nivel de luminosidade 


0 

Ausente 

1 2 3 

4 

0 

Presente 

1 2 3 

4 

Estado da popula^ao 

Em declinio 

Protegida 

Nao 

2 

0 

2 

2 

0 

1 

0 

0 

7 

4 


Sim 

1 

0 

1 

1 

0 

1 

0 

0 

2 

2 

Estavel ou aumentando 

Nao 

0 

0 

1 

1 

4 

1 

1 

2 

2 

3 


Sim 

3 

1 

0 

14 

2 

0 

0 

4 

6 

2 


As populates sao classificadas de acordo com o estado da popula<;ao (em declinio ou estavel), o estado de 
prote^ao (sim ou nao), a presence de especies invasoras (sim ou nao) e quanto ao nivel de luminosidade (5 
niveis: 0 = menor, 4 = maior). Cada celula, na tabela, representa o numero de populates encontrado em 
uma combina^ao de condi^oes em particular. Por exemplo, ha 14 populates protegidas que estao estaveis 
ou aumentando em locais sem especies invasoras e nivel de luminosidade 3. Ha 7 populates desprotegidas 
em declinio, em locais com especies invasoras presentes e com nivel de luminosidade 3. Esses dados podem 
ser analisados como uma tabela de contingencia de quatro fatores. O estado da popula^ao e tratado como 
variavel resposta e o nivel de luminosidade, o estado de prote^ao e a presen^a de especies invasoras como 
variaveis preditoras. (Dados de Farnsworth, 2004.) 
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res com mais dimensoes. Por exemplo, para visualizar os dados de Farnsworth 
(2004) sobre os cinco niveis de luminosidade, podemos juntar 5 tabelas de dois 
fatores. Cada tabela dessas poderia mostrar a contagem de prote«;ao e o estado 
da populanao sob os diferentes mveis de luminosidade. Por fim, se desejarmos 
incluir o estado de especies invasoras como um quarto fator, o conjunto inteiro 
de tabelas de dois fatores teria que ser duplicado para populates com e sem 
especies invasoras. 

Um leiaute alternative para uma tabela de contingencia com quatro fatores 
e mostrado na Tabela 11.5. Esse leiaute ilustra a associa^ao entre o estado da po- 
pula^ao, a presen^a de especies invasoras, o estado de prote^ao e o nivel de lu¬ 
minosidade. Cada celula da o numero de populates registrado para uma dada 
combina^ao de categorias. Por exemplo, 14 populates protegidas que nao esta- 
vam em declinio foram registradas em locais com nivel de luminosidade 3 e sem 
especies invasoras. Sete populates desprotegidas e em declinio foram registradas 
em locais com nivel de luminosidade 3 e com especies invasoras. Essa tabela e 
mais dificil de interpretar do que uma de dois fatores, mas um grafico mosaico 
(Figura 11.2) novamente fornece uma forma conveniente e rapida para visualizar 
dados multidimensionais. 

Voce pode ver que quanto mais fatores sao incluidos na tabela, mais especifica 
e detalhada sera a caracteriza^ao das populates. Portanto, quanto mais fatores 
sao incluidos, mais o tamanho amostral em cada celula e reduzido, pois o numero 
total de observances e dividido entre um numero maior de celulas. 

As variAveis SAO independentes? Como na analise de uma tabela de dois fatores, 
queremos saber se as variaveis em uma tabela multifatorial sao associadas umas 
com as outras. Contudo, existem muito mais formas para os dados multifatoriais 
estarem associados uns com os outros do que ha para com dois fatores. Antes de 
passarmos para a rigida especificanao de uma hipotese nula adequada, precisa- 
mos entender como calcular os valores esperados em uma tabela de contingencia 
multifatorial. 

Reprise: valores esperados para uma tabela de contingencia de dois fato¬ 
res Podemos calcular os valores esperados para uma tabela de contingencia 
multifatorial expandindo um metodo alternativo empregado no calculo de valo¬ 
res esperados de uma tabela de contingencia de dois fatores. Fique atento a nossa 
descrinao desses calculos, pois irao fornecer nao so uma nova forma de testar hi- 
poteses em tabelas dos fatores, mas tambem uma base firme para analisar hipote- 
ses em tabelas multifatoriais. 

Para uma tabela de dois fatores com i - 1 a n linhas ej = 1 a m colunas, calcu- 
lamos o valor esperado para cada celula usando a Equanao 11.4: 


m 


n 



total das linhas x total da colunas _ j =i 


tamanho amostral 


N 


Se tirarmos o logaritmo natural de ambos os lados da Equanao 11.4, obtemos: 
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Desprotegidas 


Sem invasao Com invasao 



10 = — = 




Protegidas 




Estado de protegao 


Figura 11.2 Um grafico mosaico ilustrando os dados da frequencia de quatro fatores da Ta- 
bela 11.5. Esses dados sao para 73 populates de especies de plantas raras, classificadas de 
acordo com seu estado de prote^ao legal (protegida ou nao), estado da popula^ao (em decli- 
nio versus estavel ou aumentando), presen^a de especies invasoras (sim ou nao) e intensidade 
luminosidade (cinco m'veis crescentes). Como na Figura 11.1, o tamanho dos retangulos e di- 
mensionado em rela^ao a frequencia relativa das celulas. As categorias principals sao o estado 
da popula^ao (em dech'nio ou estavel/aumentando, no eixo-y) e a prote^ao legal (estado de 
prote^ao no eixo-x), e estes retangulos maiores sao do mesmo tamanho em rela^ao aqueles da 
Figura 11.1. As categorias principals sao, entao, subdivididas em afetadas ou nao afetadas por 
plantas invasoras (divisoes sem invasao e com invasao, no eixo-x) e em cinco niveis de lumino¬ 
sidade no eixo-y. Cada rn'vel e indicado com um sombreamento diferente (preto = 0, verde mais 
escuro = 1, verde medio = 2, verde claro = 3 e cinza = 4). As celulas com frequences = 0 sao in- 
dicadas por linhas pontilhadas; por exemplo, nao ha nenhuma popula^ao amostrada que esteja 
desprotegida e em dech'nio, em locais sem especies invasoras e com m'vel de luminosidade 1 ou 
4. Dados de Farnsworth (2004). 


(11.14) 


;=i 


;=i 


Assim, o logaritmo natural dos valores esperados em cada celula sera a 
soma dos logaritmos naturais do total da linha, mais o logaritmo natural do 
total das colunas, menos o logaritmo natural do total geral (que e igual ao ta¬ 
manho amostral). 
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Se reescrevermos a Equa^ao 11.14 simbolicamente como: 

Intfy ) = [«] + [ (11.15) 


ela devera lembra-lo da equa^ao basica para o modelo de uma analise de variancia 
com dois fatores (Capitulo 10, Equa^ao 10.10), 

Yjj = (J, + Aj + Bj + AB- 

embora o termo de intera^ao (A£ (/ ) nao conte em nossa equaqao para tabelas 
de contingencia. Por analogia com a ANOVA, o [0] na Equa^ao 11.15 e a media 
geral dos valores preditos (|i na equa^ao da ANOVA) e [A] e [5] sao os efeitos 
principals, devido as variaveis das linhas e das colunas (A, e na equaqao da 
ANOVA). 

Os termos na Equa^ao 11.5 sao calculados como a seguir. A media geral [0] e 
a mesma dos logaritmos naturais das frequences esperadas em cada celula: 



(11.16) 


Para cada linha, o efeito principal [A] linha e a media do logaritmo natural da 
soma das linhas esperadas, menos a media geral: 





(11*17) 


Para cada coluna, o efeito principal [B] co | una e a media do logaritmo natural da 
soma das colunas esperada menos a media geral: 


[B] 


coluna 



(11.18) 


Note que tanto [A] linha quanto [B] cgluna s ao residuos: representam os desvios da 
media geral [0]. Portanto, se pegarmos a soma de todas as linhas de [A] e a soma 
de todas as linhas de [B], os resultados devem ser iguais a 0: 

n m 

W; =^ B ioluna(j) = 0 (11.19) 

<=i ;=i 

A Equa^ao 11.15 nao inclui o termo de intera^o [AB] (equivalente ao ter¬ 
mo AB tl da equa^ao da ANOVA). Por que nao? Em uma tabela de dois fatores, 
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estamos testando a hipotese nula de que duas variaveis sao independentes e o 
termo de intera^ao [ AB] = 0; nossa hipotese e de que nao ha intera^ao entre 
variaveis independentes. Portanto, calculamos os valores esperados para cada 
celula usando a Equa^ao 11.14, pois ela corresponde a hipotese nula de nenhu- 
ma interaqio. 


Sobre as tabelas multifatoriais! 

Podemos facilmente estender as Equates 11.14 a 11.19 para tabelas de contin¬ 
gency de qualquer dimensao. Em vez de linhas e colunas, iremos generalizar para 
d (dimensoes) e indexar usando subscritos i,j, k,... Cada dimensao pode assumir 
um numero arbitrario de niveis, que iremos indexar usando os subscritos n , m, p 
eq... Portanto, para nossos dados com quatro dimensoes, na Tabela 11.5, precisa- 
mos calcular os valores para as quatro dimensoes i,j, k, /. Aplicando a nota^ao da 
Equa^ao 11.15, usamos o modelo: 


l n (T; ,j,kj ) - [6] + [^1 + [B] + [C] + [D] + [AB] + [AC] + [AD] + [BC] + 
[BD] + [CD] + [ABC] + [ABD] + [ACD] + [BCD] 


( 11 . 20 ) 


(omitimos os subscritos dos termos entre colchetes [...] para dar clareza). Esta 
equac^ao e chamada de modelo log-linear, pois o logaritmo das frequences espe- 
radas e uma fun^ao linear das variaveis preditoras. Voce viu outro exemplo de um 
modelo log-linear quando discutimos regressao logistica, no Capitulo 9. 

Voce tambem pode notar que o termo de intera^ao completo, [ABCD], nao 
aparece na Equa^o 11.20. Por que? Se adicionarmos essa intera^ao na Equa^o 
11.20, os valores esperados seriam exatamente iguais aos observados, e entao o 
ajuste seria perfeito! Mas e claro que nao estamos interessados nisso, mas, sim, 
em quao bem os dados podem ser ajustados por um modelo com menos para- 
metros quanto possivel. Podemos usar a Equa^ao 11.20, portanto, para testar a 
hipotese de que o termo da intera^ao completa [ABCD] e igual a zero. Calcu¬ 
lamos os valores esperados usando a Equa<;ao 11.20 e usamos a Equa^ao 11.15, 
ou a Equa^ao 11.17, para calcular a estatistica chi-quadrado ou a estatistica-G. 
Infelizmente, resolver a Equa^ao 11.20 para obter os valores esperados e dificil 
(Fienberg, 1970). 

Usando o programa S-Plus, calculamos os valores esperados para a Tabela 
11.5, calculamos a estatistica chi-quadrado (Equa^ao 11.15) e seu valor de P as- 
sociado, e testamos a hipotese de que as quatro variaveis sao independentes. A 
estatistica chi-quadrado = 53,32, para 32 graus de liberdade, tern um valor de P 
de 0,01. Portanto, rejeitamos a hipotese nula e concluimos que as quatro variaveis 
nao sao independentes. 

Contudo, esse valor de P geral nos diz apenas que, no minimo, duas variaveis 
nao sao independentes, mas nao aponta qual delas. Similarmente, quando obte- 
mos um valor de P pequeno para uma ANOVA de um fator, sabemos que as me- 
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dias dos grupos de tratamento em geral diferem, mas nao sabemos quais medias 
em particular sao diferentes ou similares. Na ANOVA, usamos contrastes a priori 
e compara^oes a posteriori para determinar quais medias sao diferentes ( ver Ca- 
pitulo 10). Em analises de tabelas de contingencia, dois metodos sao disponiveis 
para determinarmos quais variaveis sao independentes e quais nao sao: modelos 
log-lineares hierarquicos e arvores de classifica^ao. 

Modelos log-lineares hierArquicos A Equa^ao 11.20 e usada para testar a hi¬ 
potese de que o termo de intera^ao de quatro fatores [ABCD] = 0. Mais especi- 
ficamente, estamos interessados em determinar quais fatores sao associados com 
o estado da popula<;ao (em declinio ou estavel). A variavel Declinio e resposta, e 
as outras tres (Protefdo, Invasao e Luminosidade) sao as variaveis preditoras. Este 
modelo, ou hipotese inicial, e equivalente a de que cada resultado da variavel de- 
clinio (sim ou nao) e independente das tres preditoras, Prote$ao, Invasao e Lumi¬ 
nosidade. Tal modelo seria parecido com: 

In Yjj k j = [0] ■+ [ A]-+ [B] + [C] + [D] + [AB} + [AC] + [BC] + [ABC] (11.21) 

onde [A] e o efeito devido a Prote^ao; [B], devido a Invasao; [C], devido a Lumi¬ 
nosidade e [D], ao Declinio. Este modelo inclui todos os termos e a intera^ao das 
tres variaveis preditoras, mas nao inclui qualquer efeito de intera«;ao com declinio 
(fator D). Por que nao? Porque nossa hipotese nula e de que o valor de declinio e 
independente das variaveis preditoras - ou seja, nao ha intera^ao entre declinio e 
qualquer uma das outras variaveis. 

Para os dados na Tabela 11.5, a estatistica chi-quadrado para o modelo descrito 
na Equa^ao 11.21 tern um valor de P de 0,004, com 19 graus de liberdade. Portanto, 
rejeitamos a hipotese nula de que o Declinio seja independente das tres variaveis pre¬ 
ditoras. Agora, precisamos examinar modelos que incorporem algumas intera^oes 
entre Declinio e as outras variaveis. Nossa estrategia e adicionar o numero minimo de 
intera^oes necessarias para ajustar o modelo. Estamos em busca do tipo mais simples 
que forne^a um bom ajuste aos dados e nao cause a rejei^ao da hipotese nula. 

Vamos come«;ar adicionando o termo de intera^ao entre Declinio e Protegao 
{[AD])-. 

In Y-j k j = [0] + [A] + [B] + [C] + [D] + [AB] + [AC] + [BC] + [ABC] + [AZ9] (11.22) 

Este modelo tern uma estatistica chi-quadrado = 29,6 com 18 graus de liber¬ 
dade, produzindo um valor de P marginalmente significativo de 0,04. Esse mo¬ 
delo e “menos significativo” que o da Equa^ao 11.21, que e o que estamos interes¬ 
sados aqui (que “nao seja significativamente diferente” do modelo hipotetico que 
“ajuste” os dados). 
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Como decidimos quais termos de intera^ao incluir no modelo e quais 
excluir? O problema e exatamente analogo ao que enfrentamos na regressao 
multipla e na analise de caminhos (Capitulo 9): escolher um subconjunto de 
variaveis importantes dentro de um conjunto maior de variaveis preditoras em 
potencial. A dica e encontrar um balan^o entre um modelo que faz um bom 
trabalho na redu<;ao dos desvios entre os valores observados e as predi<;6es do 
modelo, mas que nao inclua tantas variaveis, de forma que ele fique superpara- 
metrizado. As estatisticas com base no criterio de informa^ao de Akaike (AIC) 
sao exemplos que fornecem um indice de “ruindade do ajuste” para levar em 
conta os desvios residuais e o numero de parametros no modelo (ver a discus- 
sao no Capitulo 9). 

Para os dados das populates de plantas, o ajuste do modelo, de fato, me- 
Ihorou com a adi^ao do termo de intera^o [Declmio x Prote$ao]. Essa melhora 
no ajuste e refletida no decrescimo do AIC de 81,81 para 73,61. Em contraste, a 
adi^ao de outros termos de intera^ao de dois fatores no modelo, [Declmio x Lumi- 
nosidade] ou [Declmio x Invasdo ], nao melhoram o ajuste do modelo. 

Por fim, consideramos a adi^ao de termos de intera^ao de tres fatores. A adi- 
9 §o de qualquer termo com tres fatores (outro que nao o [ABC] na Equa^ao 11.21) 
resultou em modelos com ajustes mais fracos, como indicado pelo aumento nos 
valores de AIC. Tais analises sugerem que o declmio das populates e reduzido 
pelo estado de prote^ao, mas elas nao sao afetadas pelo nivel de luminosidade ou 
pela presen<;a de especies invasoras no local. 

Os modelos que testamos nesta analise sao hierarquicos - os termos do 
modelo mais simples (que excluem certas intera^oes) sao subconjuntos ani- 
nhados dos modelos mais complexos (que os incluem). Considerando todas 
as combina^oes possiveis e as intera^oes entre as quatro variaveis, existem 74 
modelos alternatives, ou hipoteses, que poderiam ser ajustados! Todos esses 
modelos incluem os efeitos principais, porem cada um tambem inclui um con- 
junto diferente de termos de intera«;ao entre as variaveis com efeitos principais. 
Se essas intera^oes sao iguais a zero ou nao sao as hipoteses de interesse. Esses 
modelos sao hierarquicos, porque, se houver um termo de intera^ao de maior 
ordem (p. ex., um termo de intera^ao com tres fatores), entao o modelo tam¬ 
bem incluira todos os termos de intera<;ao de menor ordem (p. ex., os de dois 
fatores). 

Graus de liberdade para modelos log-lineares Voce deve ter notado que os 
diferentes modelos que ajustamos aos dados da Tabela 11.5 tinham graus de 
liberdade diferenciados. Para uma tabela de dois fatores, os graus de liberdade 
eram iguais ao produto de 1 menos o numero de linhas x 1 menos o numero 
de colunas. Para tabelas multifatoriais, o numero de graus de liberdade tern 
base no somatorio dos graus de liberdade para os efeitos principais e para to¬ 
dos os termos de intera^ao. Os graus de liberdade para os termos de intera<;ao 
sao calculados exatamente da mesma forma que para a ANOVA (ver Capitulo 
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10). Se o Fator A possui a categorias, e o Fator B possui b categorias, os graus 
de liberdade para o termo da intera<;ao A x B = (a - 1) x (b- 1). Para o modelo 
completo (todos os efeitos principais e intera<;6es, exceto a intera^ao entre os 
quatro fatores ABCD), o numero de graus de liberdade v e calculado como: 

v - nmpq—[l + 

(m —l) + (m—l) + (p—1) + (<j —1) + 

(n-l)(m-l) + {n-l){p-\) + (n-\)(q-l) + (tn-l)(p-l) + (m-l)(q-l) + {p-l)(q-l) + 
(n-l)(m-l)(p-l) + (n-l){m-l)(q-l) + (n-l){p-l)(q-l)+(m-l)(p-\)(q-l)) 

(11.23) 

onde n,m,peq sao os numeros de possiveis niveis das variaveis A,B,Ce D, res- 
pectivamente. Em nosso exemplo, os Fatores A, B e D possuem 2 niveis (sim ou 
nao) enquanto o Fator C (luminosidade) possui 5 niveis. Se voce olhar atenta- 
mente para todos esses termos, deve conseguir reconhecer os componentes dos 
4 efeitos principais (a segunda linha da Equa^ao 11.23), os 6 termos de intera^ao 
entre dois fatores (a terceira linha da Equa<;ao 11.23) e os 4 termos de intera^ao 
entre tres fatores (ultima linha na Equa^ao 11.23). Este modelo completo, portan- 
to, teria 4 graus de liberdade. Note que, quanto mais termos incluimos no mode¬ 
lo, menos graus de liberdade sobram para avaliar o ajuste dos dados ao modelo. 
Quando testamos um modelo hierarquico, perdemos graus de liberdade, pois os 
do teste, na verdade, refletem a diferenga entre os graus de liberdade desse modelo 
e o proximo modelo na hierarquia. 

O primeiro modelo que avaliamos, Equa<;ao 11.21, teria: 

V = nmpq — [ 1 + 

(n — l) + (m — i) + {p — l) + (q — i) + 

(;n — 1 )(m — 1) + (n — l)(p — 1) + (m — 1 )(p —1) + 

(n —l)(m —l)(p — 1)] (11.24) 

graus de liberdade. Os quatro termos na segunda linha sao para os efeitos prin¬ 
cipais, os proximos tres termos correspondem as intera 9 oes entre os pares ([A£], 
[AC] e [BC ], respectivamente) e o ultimo termo e para a intera<;ao entre os tres 
fatores [ABC]. A solu^ao da Equa^ao 11.24 para as nossas quatro variaveis =19 
graus de liberdade, como mostramos acima. O modelo na Equa^ao 11.22, que 
adiciona o termo de intera^ao declmio x protegao ([AD]) tern um grau de li- 
berdade a menos [( n — l)(q - 1) = 1], ou 18 graus de liberdade. Voce pode nao 
conseguir calcular modelos hierarquicos a mao, mas deve pelo menos conseguir 
reconstruir os graus de liberdade, entender e interpretar os resultados das estatis- 
ticas do modelo ajustado. 
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Arvores de classificaqAo As arvores de classifica^ao sao uteis, tanto para ex- 
plorar quanto para modelar dependences entre variaveis tabulares ou categoricas. 
Embora elas nao sejam muito usadas na analise estatistica de dados ecologicos, a 
maioria dos ecologos e biologos da area ambiental esta um tanto familiarizada 
com um tipo de arvore de classifica^ao - a chave taxonomica, que e usada para 
identificar a especie de um organismo. 

Em uma chave taxonomica, uma serie de decisoes binarias sao feitas acerca 
de caracteristicas morfologicas do especime (p. ex., folhas versus espinhos). Estas 
forquilhas das chaves taxonomicas levam a distin^oes mais e mais especificas (p. 
ex., folhas simples versus folhas compostas) e a chave finalmente termina quando 
nao ha mais nenhuma ramifica<;ao e chegamos esperan^osamente a uma identifi- 
ca<;ao correta da especie (p. ex., Acer rubrum - bordo vermelho). Dados tabulares 
podem ser analisados com base em estatisticas da mesma forma, com a arvore 
de classifica^ao indicando forquilhas dicotomicas dos dados que refletem parti¬ 
es nas variaveis categoricas. Faremos, aqui, apenas uma breve introdu«;ao a essa 
tecnica, os exemplos ecologicos adicionais sao fornecidos por De’ath & Fabricus 
(2000) e detalhes estatisticos podem ser encontrados em Breiman et al. (1984) e 
Ripley (1996). 

As arvores de classifica«;ao sao construidas a partir de um conjunto de dados 
categoricos em grupos cada vez menores, nos quais cada divisao depende de uma 
unica variavel. Cada uma resulta em dois grupos, e cada grupo sera novamente 
dividido com base em uma unica variavel. Em uma chave taxonomica, a divisao 
prossegue ate que haja apenas uma especie no final de cada “galho”. Em arvores 
de classifica^ao, a divisao continua apenas ate que nenhuma melhora no ajuste do 
modelo seja obtida em rela^ao ao niimero de divisoes aplicado. 

Raras vezes, apenas uma das divisoes descrevera um grupo. Em vez disso, 
uma divisao resulta em um grupo caracterizado por uma probabilidade relati- 
vamente alta de que ocorra em uma ou mais classes (resultados de uma varia¬ 
vel em particular) em rela^ao as outras. A divisao e concluida quando o ponto 
terminal for o mais homogeneo ou consistente possivel, dada a incerteza nos 
dados. Um no que prediz que todas as replicas estejam em uma classe e comple- 
tamente homogeneo (ou puro) e tern um valor de impureza igual a zero. Para 
arvores de classifica^ao, a impureza e fundamentada na propor^ao p de replicas 
em cada uma das n classes. 

A impureza aumenta conforme a habilidade preditiva decresce e pode ser 
calculada com um indice de informa^ao (entropia) familiar aos ecologos, como 
indice de Shannon-Weiner: 

n 

Impureza = —^ p, ln(p,) 


(11.25) 
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ou como o Indice de Gini: 6 


n 

Impureza = 1 — ^p, 2 (11.26) 

i=l 


A divisao da arvore ocorre pela minimiza^ao da Equa<;ao 11.25 ou da Equa- 
9 ao 11.26 de cada divisao. Minimizar esses indices e, a grosso modo, equivalente a 
calcular distributes de probabilidade condicional de uma variavel A para cada 
classe da B, como descrito por Legendre & Legendre (1998, 230ff.). Para qualquer 
um desses indices, uma amostra completamente pura (p = 1,0, com todas as repli¬ 
cas classificadas em um grupo) gera um valor do indice de zero. 

Mais uma vez usamos os dados da Tabela 11.5 para ilustrar esse procedimen- 
to. Como na analise de modelos log-lineares, estamos tentando determinar quais 
fatores melhor predizem quando uma popula<;ao esta ou nao em declinio.' 

Nosso conjunto de dados contem 73 observances: 26 populates estao em 
declinio e 43 estaveis ou aumentando. A primeira divisao separa os dados em 
dois grupos: um com 40 populates e outro com 33 (Figura 11.3). Tal divisao 
fundamenta-se no estado de prote^ao. Como discutimos, as populanoes que 
estao protegidas sao muito mais provaveis de estarem estaveis ou aumentando 
(32 dentre 40 populates) que em declinio (8 dentre 40 populates, Figura 


6 Ambos indices possuem uma historia interessante na ecologia e tern sido usados como medidas 
de diversidade de especies. O indice de diversidade e calculado tratando p i como a fra^ao de in- 
dividuos em uma amostra aleatoria que representa a especie i. O indice de Shannon-Weiner veio 
da teoria de informa^ao (Margalef, 1958) e e uma medida da incerteza ou “informa^ao contida” 
em uma sequencia de digitos binarios. A ideia de que o indice de Shannon-Weiner e uma medida 
da entropia de uma comunidade ou ecossistema (revisado por Goodman, 1975) nao e mais jus- 
tificada (Hurlbert, 1971). O indice de Shannon-Weiner tambem possui propriedades estatisticas 
ruins: ele confunde riqueza de especies e equitabilidade, alem de ser muito dependente do tamanho 
amostral. Todavia, ele continua sendo usado como um indice de diversidade, particularmente em 
estudos de polui^ao da agua. 

O indice de Gini* e menos popular, mas na verdade possui bases estatisticas mais firmes como 
uma medida de diversidade. Em uma forma modificada, esse indice e equivalente a Probabilidade de 
Encontro Interespecifico (PEI), de Hurlbert (1971). A PEI mede a probabilidade de que dois indivi- 
duos, escolhidos randomicamente a partir de uma comunidade, representem duas especies diferen- 
tes. Diferente do indice de Shannon-Weiner, a PEI possui uma interpreta^ao estatistica simples e e 
relativamente insensivel ao tamanho amostral (Gotelli & Graves, 1996). Magurran (2003) apresenta 
uma discussao compreensiva dos potenciais, das fraquezas e das propriedades estatisticas de muitos 
indices de diversidade ecologica. 

1 Para este exemplo, a constru^ao da arvore foi feita usando o pacote RPART do S-Plus, versao 6.1. 
Os detalhes da computa^ao para produzir arvores de classifica^ao podem ser encontrados em Ripley 
(1996) e em Venables 8c Ripley (2002). 

* N. de T. Tambem chamado de “indice de Simpson”. 
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Todas observances (N = 73) 


Desprotegidas (N = 33) 


Protegidas (N = 40) 


Estaveis ou aumentando (32 de 40) 


Luminosidade = 
1,2, ou4(A/= 16) 


Luminosidade = 
0 ou 3 (N = 17) 


Em declinio (12 de 16) 


Estaveis ou aumentando (11 de 17) 


Figura 11.3 Arvore de classificanao para os dados de populates de plantas raras da Tabela 11.5. 
Essa arvore prediz o estado da populagao (em declinio versus estavel ou aumentando) em fun^ao 
do de protenao, do nivel de luminosidade e se ha ou nao especies invasoras presentes. 0 modelo 
de melhor ajuste inclui o estado de protegao como forquilha primaria, com o nivel de luminosida¬ 
de usado para dividir o grupo de populates desprotegidas em dois grupos. Note que o tamanho 
amostral final na ponta dos tres galhos (16 + 17 + 40) se refere as 73 populates do conjunto de 
dados (Tabela 11.5). 

11.1). Voce nao deve estar surpreso de que o numero total de observances em 
cada um desses dois grupos seja igual ao total das colunas da Tabela 11.2. 

O grupo restante de 33 observances (populanoes desprotegidas) consiste 
de 18 populanoes que estao em declinio e 15 estaveis ou aumentando - quase 
meio-a-meio. Dividimos esse grupo mais uma vez em dois grupos, agora com 
base na disponibilidade de luz (Figura 11.3). Dentro do grupo de desprotegidas, 
as que estao em locais com nivel de luminosidade 0 ou 3 sao mais provaveis de 
estarem estaveis ou aumentando (11 de 17 populanoes), enquanto as que estao em 
locais com niveis de luminosidade 1,2 ou 4 provavelmente estao em declinio (12 
de 16 populanoes). 

Nenhuma melhora significativa no ajuste e obtida por divisoes adicionais 
desses grupos, portanto a construnao da arvore termina aqui. Note que a primeira 
divisao corresponde a adinao do termo de interanao declinio x prote$ao ([AD]) 
na Equanao 11.22. A segunda divisao corresponde a adinao do termo declinio x 
protegao x luminosidade [ACD] ao modelo. Na analise log-linear, a inclusao desse 
termo da interanao de tres fatores melhorou o ajuste do modelo em relanao a 
Equanao 11.22 (P = 0,11 com esse termo versus P = 0,04 sem ele). Contudo, a pe- 
nalizanao por adicionar essa interanao (ela reduz os graus de liberdade de 18 para 
14) aumentou o AIC de 73,61 para 75,50. Pelas “regras” da selenao de modelos 
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log-lineares, essa intera^ao de tres fatores nao foi retida, embora surja como uma 
forquilha significativa na arvore de classifica<;ao. 

Nao fique incomodado com estas aparentes inconsistencias entre os resulta- 
dos de diferentes tipos de analises estatisticas. Como os modelos log-lineares e as 
arvores de classifica^ao em diferentes criterios de sele^ao e diferentes regras de 
parada, elas podem dar respostas diferentes quando usadas com o mesmo con- 
junto de dados. Nenhuma analise e “melhor”ou “correta”, embora, no contexto de 
decisoes de manejo, a arvore de classificaqao pode ser mais facil de interpretar que 
as analises de modelos log-lineares. As arvores de classifica^ao tambem podem 
ser usadas quando os preditores forem variaveis continuas ou quantitativas. Tais 
arvores sao chamadas de arvores de regressao. 

Abordagens bayesianas para tabelas de contingencia 

Os ecologos com frequencia se referem aos testes de chi-quadrado e teste-G 
como nao parametricos. Em contraste, a ANOVA e a regressao sao consideradas 
testes parametricos, pois elas assumem que os dados e os residuos tern distribui- 
qao normal (ver Capitulo 5). Como o teste-G e o chi-quadrado geram valores 
esperados a partir dos proprios dados, alguns pesquisadores erroneamente acre- 
ditam que nao ha nenhuma distribui^ao de probabilidades subjacente necessa- 
ria para o teste. De fato, este nao e o caso. A modelagem log-linear, subjacente 
ao teste-G, assume que uma distribui^ao de Poisson ou multinomial descreve 
os dados. Tal pressuposto tambem nos permite usar tecnicas bayesianas para 
analisar tabelas de contingencia. 

Os metodos bayesianos para tabelas de contingencia caem em duas categorias 
amplas. Um conjunto de metodos estima as frequences esperadas como distri¬ 
butes (com modas ou medianas iguais aos valores esperados). Para dada celu- 
la, se o intervalo de credibilidade do valor esperado inclui o valor observado, as 
linhas e colunas sao consideradas independentes (Lindley, 1964; Leonard, 1975; 
Gelman et al., 1995). 

O outro conjunto de metodos estima valores para os parametros (com in¬ 
tervals de credibilidade) para os termos em modelos hierarquicos log-linea¬ 
res; os parametros cujos intervalos de credibilidade incluem o zero sao retira- 
dos do modelo final. Os metodos bayesianos para escolher entre os modelos 
log-lineares usam criterios de sele^ao similares ao AIC (Madigan & Raftery, 
1994; Albert, 1996,1997; Gelman et al., 1995). A aplica^ao de metodos bayesia¬ 
nos para arvores de classifica^ao e uma area ativa da pesquisa estatistica atual 
(Denison et al., 2002), mas infelizmente ela vai muito alem do escopo desse 
livro de introdu^ao. 

TESTES PARA BONDADE DO AJUSTE 

Os testes estatlsticos que encontramos neste livro, se parametricos ou bayesianos, 
assumem que nosso conjunto de amostras ou observances refletem com acuracia 
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uma variavel aleatoria com alguma distribui^ao subjacente. Os exemplos incluem 
a binomial, Poisson, normal, log-normal ou exponencial (Capitulo 2). As analises 
consistentes tambem devem resultar em um conjunto de residuos que sao distri- 
buidos de acordo com uma distribui^ao conhecida, em geral a normal. Usamos os 
testes de bondade do ajuste, que sao similares em estrutura aos de chi-quadrado 
e G, para determinar se nossos dados observados se ajustam a uma distribui^ao 
hipotetica ou se nossos residuos se adequam a distribui<;ao normal (ou outra). Os 
testes de bondade do ajuste tambem sao importantes para testar modelos ecolo- 
gicos especificos. Se os modelos fazem predi^oes quantitativas acerca dos valores 
esperados para diferentes categorias de dados, podemos usar testes de bondade 
do ajuste para ver quao bem nossos dados se adaptam as predi^oes de diferentes 
modelos (Hilborn & Mangel, 1997). 

Um teste de bondade do ajuste funciona quase da mesma forma que os de 
independence apresentados neste capitulo: um conjunto de observances de 
uma unica variavel e comparado aos valores esperados, dada uma distribui^ao 
em particular. Os mecanismos sao identicos - use a Equa^ao 11.5, para um teste 
de bondade do ajuste de um teste de chi-quadrado, ou a Equa^ao 11.7, para um 
teste de bondade do ajuste de um teste-G. Esses dois testes funcionam bem para 
distributes discretas e variaveis aleatorias, mas nao com distributes con- 
tinuas, como a do tipo normal. Para distributes continuas, iremos apresen- 
tar um procedimento diferente, o teste de Kolmogorov-Smirnov, para avaliar a 
bondade do ajuste. 

Teste de bondade do ajuste para distributes discretas 

Como um exemplo simples, retornaremos a controversia sobre a honestidade da 
moeda do Euro Belga (ver Capitulo 1, Nota de rodape 7). Dois estatisticos lan^a- 
ram uma moeda do Euro Belga 250 vezes e observaram 140 caras e 110 coroas. 
A moeda do Euro Belga e honesta? Em outras palavras, esses dados se ajustam 
as frequences esperadas de caras e coroas a partir de uma distribuinao binomial 
com p = 0,50? 

Teste de chi-quadrado e teste-g para dados binomiais A probabilidade de dar 
cara em uma moeda honesta e equivalente a 0,5. Portanto, a frequencia esperada 
de caras e coroas sao de 125 e 125. Agora, temos valores observados e esperados, e 
podemos calcular qualquer uma das duas estatisticas: X 2 Pearson (Equa^ao 11.5) ou 
G (Equa^ao 11.7). A estatistica X 2 Pearson = (140 - 125) 2 /125 + (110 - 125) 2 /125 = 
3,60 e a estatistica-G = 2[140 x ln( 140/125) + 110 x ln( 110/125)] = 3.61. Ambos 
sao distribuidos como variaveis aleatorias yj e possuem valores de probabilida¬ 
de em cauda de 0,0577 e 0,0574, respectivamente. Esses valores de P sao muito 
pequenos, mas, por serem > 0,05, eles nao sao considerados significativos pelos 
testes de hipoteses convencionais nas ciencias. Portanto, concluimos que os dados 
observados se ajustam a uma distribuinao binomial, e que ha evidencias insufi- 
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cientes (apenas fracas) para rejeitar a hipotese nula de que o Euro Belga seja uma 
moeda honesta. 8 

Alternativa bayesiana Os testes assintoticos classicos e o teste exato falham, 
apenas marginalmente, em rejeitar a hipotese nula de que a moeda do Euro Belga 
e honesta (testando a hipotese P(dados | H 0 ). Em vez disso, uma analise bayesiana 
testa P(H, | dados) questionando: os dados realmente fornecem evidencia de que 
o Euro Belga e tendenciosa? Para avaliar essa evidencia, precisamos calcular a ra¬ 
zao de chances a posteriori, como descrito no Capitulo 9 (usando a Equa<;ao 9.49). 
Mackay (2002) e Hamaker (2002) conduziram essas analises usando varias distri¬ 
butes diferentes de probabilidade a priori. Primeiro, se inicialmente nao temos 
nenhuma razao para preferir uma hipotese a outra (H 0 : a moeda e honesta; H,: a 
moeda e tendenciosa), entao a razao de suas priores e = 1 e a razao de chances a 
posteriori e igual a de verossimilhan<;as 

P(data | H 0 ) 

P(data | Hj) 

As verossimilhan 9 as (numerador e denominador) desta razao sao calcula- 
das como: 


l 

P(D | Hj) = |P(D | p,H f )P(p| Hj)dp (11.27) 

o 

onde D sao os dados, Hj qualquer uma das hipoteses (i = 0 ou 1) ep e a probabilida¬ 
de de sucesso em uma tentativa binomial. Para a hipotese nula (moeda honesta) a 
nossa probabilidade a priori e de que nao ha nenhuma tendencia. Portanto, p - 0,5 
e a verossimilhan^a P(dados | H 0 ) e a probabilidade de obter exatamente 140 caras 
em 250 tentativas, = 0,0084 (ver Nota de rodape 8). Para a hipotese alternativa (mo¬ 
eda tendenciosa), contudo, existem no minimo tres formas de estipular as priores. 


8 Esta probabilidade tambem pode ser calculada com exatidao usando a distribui^ao binomial. A 
partir da Equa^ao 2.3, a probabilidade de obter exatamente 140 caras em 250 lan^amentos com uma 
moeda honesta e: 


^ 250 > 

, 140 , 


0,5 ho O,5 


250-140 


= 0,0084 


Mas, para um teste de significancia bicaudal, precisamos da probabilidade de obter 140 ou mais 
caras em nossa amostra, mais a probabilidade de obter 110 ou menos coroas em nossa amostra. Por 
analogia ao Teste Exato de Fisher, discutido neste capitulo, simplesmente adicionamos as probabili- 
dades de obter 140,141,..., 250 caras e 0, 1,..., 110 coroas em uma amostra de 250, com probabili¬ 
dade esperada de 0,50. Esta soma = 0,0581, um valor praticamente identico ao obtido com os testes 
de chi-quadrado e G. 
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Primeiro, poderiamos usar uma priore uniforme, o que significa dizer que 
nao temos nenhum conhecimento inicial de quanta tendencia pode haver; por- 
tanto, todas sao igualmente provaveis, e P(p | H,) = l.A integral reduz, entao, 
para a soma das probabilidades sobre todas as escolhas de p (de 0 a 1) da expansao 
binomial para 140 caras entre 250 tentativas: 


P(D |H,) = £ 


1 ^ 250 a 


p=ov 140 7 


p 140 (l-p) llu = 0,00398 


sllO 


(11.28) 


A razao de verossimilhan^a e, portanto, 0,0084/0,00398 =2,1, ou aproximada- 
mente 2:1 chances a favor do Euro Belga ser uma moeda honestal 

Alternativamente, poderiamos usar priores mais informativas. A priore con- 
jugada (ver Capitulo 5, Nota de rodape 11) para a distribui^ao binomial e a dis- 
tribui^ao beta, 


P(p|H 1 ,a) = ^^p“-i (1 -p)«-i 

(11.29) 

Ha) 2 



ondepeaprobabilidadedesucesso, T(a) eadistribui^aogama,eaeumparame- 
tro variavel que expressa nossa convic<;ao a priori de que a moeda e tendenciosa. 
Conforme o a aumenta, nossa convic^ao na tendencia da moeda tambem au- 
menta. A verossimilhan^a de H, agora e: 

P(D\H l ) = ^^[ 25 °}f p' 4 ^ a ~\l-p) uo+a ~'dp (11.30) 

r(«) 2 U 4 oJ Jo 


Para a =1, temos a priore uniforme (e usamos a Equa^ao 11.28). Resolvendo 
iterativamente a Equa«;ao 11.30, podemos obter razoes de verossimilhan<;a para 
uma ampla gama de valores de a. A razao de chance mais extrema obtida usando 
a Equa^ao 11.30 (lembre que o numerador e fixo em 0,0084) e 0,52 (quando a 
= 47,9). Para esta priore informativa, as chances sao de aproximadamente 2:1 (= 
1/0,52) a favor do Euro Belga ser uma moeda tendenciosa. 

Por fim, podemos especificar uma priore bem robusta que se adequa exata- 
mente aos dados:p = 140/250 = 0,56. Agora, a verossimilhan^a de H, = 0,05078 (a 
expansao binomial na Equa^ao 11.28, com p = 0,56) e a razao de verossimilhan^a 
e = 0,0084/0,05078 = 0,16, ou 6:1 chances (= 1/0,16) a favor do Euro Belga ter 
exatamente a tendencia observada. 

Embora nossas priores mais informativas sugiram que a moeda e tendencio¬ 
sa, para concluir isso tivemos de especificar priores que sugerem um forte avan<;o 
no conhecimento de que o Euro de fato seja tendencioso. Uma analise bayesiana 
objetiva deixa os dados “falarem por si so” usando priores nao informativas, como 
a uniforme e a Equa^ao 11.28. Aquela analise fornece pouco suporte para a hipo- 
tese de que o Euro Belga e tendencioso. 
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Em soma, as analises assintotica, exata e bayesiana concordam: e mais pro- 
vavel que o Euro Belga seja uma moeda honesta. A analise bayesiana e muito po- 
derosa neste contexto, pois fornece uma medida da probabilidade da hipotese de 
interesse. Em contraste, a conclusao da analise frequentista recai sobre valores de 
P que sao apenas um pouco maiores que o valor critico de 0,05. 

Generalizando o teste de chi-quadrado e o teste-g para distributes discre- 
tas multinomiais Tanto o chi-quadrado quanto o teste-G podem ser usados 
para avaliar o ajuste de dados que possuem mais de dois niveis de distributes 
discretas, como a de Poisson e a multinomial. O procedimento e o mesmo: calcule 
os valores esperados, aplique a Equa^ao 11.5 ou a 11.7, e calcule a probabilidade 
de cauda da estatistica-teste em rela^ao a distribui^ao yj com v graus de liberdade. 
A unica parte complicada e determinar os graus de liberdade. 

Distinguimos dois tipos de distributes que usamos para aplicar testes de 
bondade do ajuste: distributes com parametros estimados independentemen- 
te dos dados e distributes com parametros estimados a partir dos proprios 
dados. Sokal & Rohlf (1995) chamam-nas de hipoteses extrinsecas e hipoteses 
intrinsecas, respectivamente. No primeiro caso, as expectativas sao geradas por 
um modelo ou por uma predi^ao que nao depende dos dados. Os exemplos 
de hipoteses extrinsecas incluem a expectativa 50:50 de uma moeda de Euro 
honesta, e a razao 3:1 de fenotipos dominantes sobre os recessivos em simples 
cruzamento mendeliano de dois heterozigotos. Para as hipoteses extrinsecas, os 
graus de liberdade sempre sao um menos o numero de niveis que uma variavel 
pode assumir. 

As hipoteses intrinsecas sao aquelas nas quais os parametros precisam ser es¬ 
timados a partir dos proprios dados. Um exemplo de hipotese intrinseca e ajustar 
os dados de contagens de eventos raros a uma distribui^ao de Poisson (ver Ca- 
pitulo 2). Neste caso, o parametro da distribui^ao nao e conhecido e precisa ser 
estimado a partir dos proprios dados. Portanto, usamos um grau de liberdade 
para o numero total de individuos amostrados e empregamos outro grau de liber¬ 
dade para cada parametro estimado. Como a distribui^ao de Poisson possui um 
parametro adicional (^., a razao de Poisson), os graus de liberdade para este teste 
seriam dois menos o numero de niveis. 

Tambem e possivel usar o chi-quadrado ou o teste-G para avaliar o ajuste de 
um conjunto de dados a uma distribui^ao normal, mas, para fazer isso, os dados 
devem primeiro ser agrupados em niveis discretos. A distribui^ao normal possui 
dois parametros a serem estimados a partir dos dados (a media |i e o desvio- 
-padrao o). Portanto, os graus de liberdade para um teste de bondade do ajuste 
para o teste-G ou de chi-quadrado a uma distribui<;ao normal e igual a tres menos 
o numero de niveis. Contudo, a distribui^ao normal e continua, e nao discreta, e 
teremos que dividir os dados em um numero arbitrario de niveis discretos para 
poder conduzir o teste. O resultado de tal teste sera diferente, dependendo do 
numero de niveis escolhido. Para avaliar a bondade do ajuste as distributes con- 
tinuas, o teste de Kolmogorov-Smirnov e mais apropriado e com maior poder. 
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Teste da bondade do ajuste a distributes continuas: o teste de Kolmogorov-Smirnov 

Muitos testes estatisticos requerem que os dados ou os residuos se ajustem a uma 
distribui^ao normal. No Capitulo 9, por exemplo, ilustramos graficos de diag¬ 
nostic para examinar os residuos de uma regressao linear (Figuras 9.5 e 9.6). 
Embora tenhamos afirmado que a Figura 9.5A ilustra a distribute esperada dos 
residuos para um modelo linear com distribute normal dos erros, gostariamos 
de ter um teste quantitative para aquela afirma^ao. O teste de Kolmogorov-Smir¬ 
nov e um desses testes. 

O teste de Kolmogorov-Smirnov compara a distribute de uma amostra de 
dados empiricos com uma distribute hipotetica, como a do tipo normal. Es- 
pecificamente, esse teste compara as fun^oes de distribute cumulativa (FDC) 
empirica com a hipotetica. A FDC e definida como a fun^ao F(Y) - P(X < Y) para 
uma variavel aleatoria X. Em palavras, se X e uma variavel aleatoria com uma 
fringe densidade de probabilidade (FDP) f(X), entao a fun^ao de distribute 
cumulativa F{Y) e igual a area sob/(X) no intervalo X < Y (ver Capitulo 2 para 
uma discussao adicional sob re FDP e FDC). Neste livro, usamos muitas vezes a 
fun^ao de distribute cumulativa - a probabilidade de cauda, ou valor de P, e a 
area sob a curva alem do ponto Y, que e igual a 1 - F( Y). 

A Figura 11.4 ilustra duas FDC. A primeira e do tipo empirica para os valores 
dos residuos de uma regressao linear, descrita no Capitulo 9, do log 10 (riqueza de 
especies de plantas) pelo log 10 (area da ilha). A segunda e uma FDC hipotetica que 
seria esperada caso os residuos tivessem distribute normal com media = 0 e 
desvio-padrao = 0,31 (esses valores sao estimados a partir dos proprios residuos). 
A FDC dos dados empiricos nao e uma curva suave, pois e proveniente de uma 
distribui^ao normal subjacente com infinitamente muitos pontos. 

O teste de Kolmogorov-Smirnov e bicaudal. A hipotese nula e de que a FDC 
observada [F obs (7)] = a FDC da distribui^ao hipotetica [F dist (Y)]. A estatistica do 
teste e o valor absoluto da diferen^a vertical maxima entre a FDC observada e a 
hipotetica (seta na Figura 11.4); basicamente, uma mede-se essas distancias em 
todos os pontos observados e pega-se a maior delas. 

Para a Figura 11.4, a distancia maxima e 0,148. Esta diferen^a maxima e com- 
parada a uma tabela de valores criticos (p. ex., Lilliefors, 1967) para um dado 
tamanho amostral e valor de P. Se a distancia maxima for menor que um valor 
critico associado, nao podemos rejeitar a hipotese nula de que nossos dados nao 
diferem da distribui^ao esperada. Em nosso exemplo, o valor critico para P - 0,05 
e 0,206. Como a diferen«;a maxima observada foi de apenas 0,148, concluimos que 
a distribui^ao dos residuos da nossa regressao sao consistentes com a hipotese de 
que os erros reais vem de uma distribu^ao normal (nao rejeitamos a hipotese 
nula H 0 ). Por outro lado, se a diferen^a maxima fosse maior que 0,206, poderia- 
mos rejeitar a hipotese nula e deveriamos questionar se o modelo de regressao 
linear, que assume que os erros tern distribui^ao normal, e o apropriado para 
analisar os dados. 

O teste de Kolmogorov-Smirnov nao e limitado a distribui^ao normal, ele 
pode ser usado para qualquer distribui<;ao continua. Se voce quer testar se seus 
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Residuo 

Figura 11 .4 Teste de bondade do ajuste para uma distribute) contmua. A compara^ao da 
fun^ao de distribute) cumulativa dos residuos observados (simbolos pretos, linha cinza) com 
a distribui^ao esperada caso elas viessem de uma distribuigao normal (linha verde). Os residuos 
sao calculados a partir da regressao especie-area do log 10 (numero de especies) pelo log 10 (area 
das ilhas) de especies de plantas das ilhas de Galapagos (dados na Tabela 8.2; ver a Figura 9.6). 
0 teste da bondade do ajuste de Kolmogorov-Smirnov compara essas duas distributes, como 
indicado pela seta deduas pontas. A diferenga maxima para esses dados e 0,148, comparado ao 
valor crftico de 0,206 para urn teste a um P = 0,05. Como a hipotese nula nao pode ser rejeitada, 
os residuos parecem seguir uma distribuigao normal, que e uma das premissas da regressao 
linear (Capitulo 9). O teste de Kolmogorov-Smirnov pode ser usado para comparar uma amostra 
de dados continuos a qualquer distribu to continua, como a normal, exponencial ou a log-nor¬ 
mal (Capitulo 2). 


dados tem distribui^ao log-normal ou exponencial, por exemplo, pode usar o 
teste de Kolmogorov-Smirnov para comparar a FDC empirica com uma FDC 
log-normal ou exponencial (Lilliefors, 1969). 


RESUM0 


Os dados categoricos de delineamentos tabulares sao um resultado comum na 
pesquisa ecologica e ambiental. Tais dados podem ser analisados com facilidade 
usando os testes familiares de chi-quadrado e teste-G. Os modelos log-lineares 
hierarquicos ou arvores de classifica^ao podem testar hipoteses detalhadas consi- 
derando associates entre variaveis categoricas. Um subconjunto desses metodos 
tambem pode ser usado para testar se a distribui^ao dos dados e dos residuos e ou 
nao consistente com, ou se sao ajustados por, uma distribui<;ao teorica em parti¬ 
cular. Alternativas bayesianas a esses testes tem sido desenvolvidas e tais metodos 
permitem a estimativa de distributees de frequences e parametros esperados em 
modelos log-lineares. 
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Analise de Dados 
Multivariados 


T odos os metodos analiticos descritos ate entao se aplicam apenas para uma 
unica variavel resposta, ou dados univariados. Varios estudos ecologicos e 
ambientais, contudo, geram duas ou mais variaveis respostas. Em particular, fre- 
quentemente analisamos como multiplas variaveis respostas - dados multivaria¬ 
dos - estao relacionadas de maneira simultanea com uma ou mais variaveis pre- 
ditoras. Por exemplo, uma analise univariada do tamanho da planta-jarro pode 
basear-se em uma unica variavel: altura do jarro. Uma analise multivariada seria 
fundamentada em multiplas variaveis: altura do jarro, abertura da boca, larguras 
do tubo e da quilha, comprimento e envergadura da asa (ver Tabela 12.1). Como 
essas variaveis respostas sao medidas no mesmo individuo, nao sao independen- 
tes entre si. Os metodos estatisticos para analisar dados univariados - regressao, 
ANOVA, testes chi-quadrado e similares - podem ser inapropriados para analisar 
multivariados. Neste ultimo capitulo, apresentaremos varias classes de metodos 
que os ecologos e cientistas da area ambiental usam para descrever e analisar da¬ 
dos multivariados. 

Assim como com os metodos univariados que discutimos nos Capitulos 9 a 
11, podemos apenas pincelar e descrever os elementos importantes das formas 
mais comuns de analise multivariada. Gauch (1982) e Manly (1991) apresen- 
tam tecnicas classicas de analise multivariada comumente usadas por ecologos 
e cientistas da area ambiental, enquanto Legendre & Legendre (1998) fornecem 
um tratamento mais aprofundado dos desenvolvimentos ate meados da decada 
de 90. O desenvolvimento de novos metodos multivariados, assim como a ava- 
lia^ao das tecnicas existentes, e uma area ativa da pesquisa estatistica. Ao longo 
deste capitulo, destacamos alguns desses novos metodos e os debates acerca 
deles. 
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ABORDANDO DADOS MULTIVARIADOS 

Os dados multivariados se parecem muito com os univariados: consistem de uma 
ou mais variaveis independentes (preditoras) e duas ou mais variaveis depen- 
dentes (respostas). A distin^o entre dados univariados e multivariados recai em 
grande parte sobre como os dados sao organizados e analisados, e nao em como 
sao coletados. 1 

A maioria dos estudos ecologicos e ambientais produz dados multivariados. 
Exemplos incluem um conjunto de diferentes medidas morfologicas, alometri- 
cas e fisiologicas realizadas em cada uma de varias plantas atribuidas a diferentes 
grupos de tratamento, uma lista de especies e suas abundancias registradas em 
multiplas estates de amostragem ao longo de um rio, um conjunto de variaveis 
ambientais (p. ex., temperatura, umidade, precipita^ao, etc.) e um conjunto cor- 
respondente de abundancias de organismos ou caracteristicas medidas em varios 
locais ao longo de um gradiente geografico. Em alguns casos, entretanto, o obje- 
tivo explicito de uma analise multivariada pode alterar o delineamento amostral. 
Por exemplo, um estudo de marca^ao-recaptura de varias especies em varios lo¬ 
cais nao seria delineado da mesma forma que um de marca^ao-recaptura de uma 
unica especie, pois diferentes metodos de analise poderao ser usados para especies 
raras versus especies comuns. 

Dados multivariados podem ser quantitativos ou qualitativos, continuos, or- 
denados, ou categoricos. Nossa aten^ao, neste capitulo, sera focada em variaveis 
quantitativas continuas. As extensoes para variaveis multivariadas qualitativas sao 
discutidas por Gifi (1990). 

A necessidade da algebra de matrizes 

A matematica das analises multivariadas e melhor expressa por meio de alge¬ 
bra de matrizes, a qual nos permite empregar equates semelhantes as usadas 
anteriormente nas analises univariadas. A similaridade e mais do que super¬ 
ficial, as interpreta^oes dessas equates sao proximas, e muitas das equates 
usadas para metodos estatisticos univariados tambem podem ser escritas com 
notat^ao de matrizes. Resumimos o basico da nota^ao e da algebra de matrizes 
no Apendice. 

Uma variavel aleatoria multivariada Y e um conjunto de n variaveis uni¬ 
variadas {Y p Y 2 , Y 3 ,.., YJ que sao todas medidas para a mesma unidade obser- 
vacional ou experimental, como uma linica ilha, planta, ou esta^ao amostral. 


1 Na verdade, voce ja foi apresentado a dados multivariados nos Capitulos 6,7 e 10. Em um delinea¬ 
mento de medidas repetidas, multiplas observa^oes sao obtidas do mesmo indivlduo em momen- 
tos diferentes. Em um delineamento em blocos randomizados ou em parcelas subdivididas, de- 
terminados tratamentos sao agrupados fisicamente no mesmo bloco. Como as variaveis respostas 
medidas dentro de um bloco ou em um unico individuo nao sao independentes entre si, a analise 
de variancia tern de ser modificada para levar em conta essa estrutura nos dados (ver Capitulo 10). 
Neste capitulo, descreveremos alguns metodos multivariados nos quais nao ha uma analise univa- 
riada correspondente. 
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Indicamos uma variavel aleatoria multivariada com uma letra maiuscula e em 
negrito, enquanto continuamos a escrever variaveis aleatorias univariadas com 
letras maiusculas em italico. Cada observa^ao em Y e escrita como y., que e 
um vetor linha. Os elementos y u desse vetor linha correspondem a medida da 
;-esima variavel Y- (com j variando de 1 ate n variaveis) medida para o indivi- 
duo i (com i variando de 1 ate m observances individuais ou unidades experi- 
mentais): 


y, = bw.-,2>n 3 >--->v 


( 12 . 1 ) 


Por conveniencia, em geral omitimos o subscrito i na Equa^ao 12.1. O vetor 
linha y e um exemplo de matriz com uma linha e n colunas. Cada observanao y U) 
dentro dos colchetes e chamada elemento da matriz (ou vetor linha) y. 

Um ecologo organizaria dados multivariados tipicos em uma planilha simples 
com m linhas, cada uma representando um individuo diferente, e n colunas, cada 
uma representando uma diferente variavel medida. Cada linha da matriz corres- 
ponde ao vetor linha y ; , e toda a tabela e a matriz Y. Um exemplo de conjunto de 
dados multivariados e apresentado na Tabela 12.1. Cada uma das m = 89 linhas 
representa uma planta diferente, e cada uma das n = 10 colunas, uma variavel 
morfologica diferente da que foi medida em cada planta. 

Varias matrizes serao recorrentes ao longo desse capitulo. A Equa^ao 12.1 
e o vetor basico n-dimensional descrevendo uma unica observa^o: y = [y v y 2 , 
y 3 ,...,yj. Tambem defmimos um vetor de medias como: 


Y=[y,.y 2 .y 3 ,...,y„] 


( 12 . 2 ) 


TABELA 12.1 Dados multivariados para a planta carnivora Darlingtonia californica 


Local 

Planta 

Altura 

Boca 

Tubo 

Quilha 

Asal 

Asa2 

Envergadura 

Massa do 
capuz 

Massa 
do tubo 

Massa 
da asa 

TJH 

i 

654 

38 

17 

6 

85 

76 

55 

1,38 

3,54 

0,29 

TJH 

2 

413 

22 

17 

6 

55 

26 

60 

0,49 

1,48 

0,06 

A 

A 

A 

A 

A 

A 

A 

A 

A 

A 

A 

A 


Cada linha representa uma unica observa<;ao de uma planta lirio-cobra (Darlingtonia californica) medida em um local 
particular (charco T.J. Howell, TJH) nas Montanhas Siskiyou no sudeste de Oregon. Cada coluna representa uma variavel 
morfologica diferente. As medidas de cada planta incluiram sete variaveis morfologicas (todas em mm): altura (altura), 
abertura da boca (boca), diametro do tubo (tubo), diametro da quilha (quilha), comprimento de cada uma das duas 
a asas” (asal, asa2) que formam o apendice com forma de cauda de peixe, a distancia entre a ponta das duas asas (enver- 
gadura). As plantas foram secas e o capuz (massa do capuz), o tubo (massa do tubo) e o apendice cauda de peixe (massa 
da asa) foram pesados (± 0,01g). O conjunto de dados total, coletado em 2000 por A. Ellison, R. Emerson, e H. Steinhoff, 
consiste de 89 plantas medidas em 4 locais. Esse e um tipico conjunto de dados multivariado: as diferentes variaveis me¬ 
didas em um mesmo individuo nao sao independentes umas das outras. 
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que e o vetor n-dimensional de medias amostrais (calculadas como descrito no 
Capitulo 3) de cada Yj. Os elementos desse vetor linha sao as medias de cada uma 
das n variaveis, Y-. Em outras palavras, Y e igual ao conjunto de medias das amos- 
tras de cada coluna da nossa matriz de dados original Y. Em uma analise univaria- 
da, a medida correspondente e a media da amostra de uma unica variavel respos- 
ta, que e uma estimativa da media real fi da popula^ao. De forma similar, o vetor 
Y e uma estimativa do vetor p = [fi,, p 2 , p 3 ,..., p„] das medias reais da popula^ao 
para cada uma das n variaveis. 

Precisamos de tres matrizes para descrever a varia^ao entre as observances y i} . 
A primeira e a matriz de variancia e covariancia, C (ver Nota de rodape 5, Capi¬ 
tulo 9). Trata-se de uma matriz quadrada cujos elementos da diagonal principal 
sao as variancias amostrais de cada variavel (calculada da forma usual; ver Capi¬ 
tulo 3, Equa<;ao 3.9). Os elementos fora da diagonal sao as covariancias amostrais 
entre todos os possiveis pares de variaveis (calcule como fizemos para a regressao 
e ANOVA: ver Capitulo 9, Equa^ao 9.10). 








5? 

C 12 

•• C 1 ,n 


C = 

C 2,l 

S 2 

•• C 2,n 

(12.3) 


_ C ".l 

C nl • 

’ i_ 



Na Equa^ao 12.3, s ( 2 e a variancia amostral da variavel Y ; , e c jk e a covariancia 
amostral entre variaveis Y- e Y k . Note que a covariancia amostral entre as variaveis 
Yj e Y k e identico a covariancia amostral entre as variaveis Y k e Y-. Portanto, os 
elementos da matriz de variancia e covariancia sao simetricos, e sao imagens-es- 
pelho uns dos outros no outro lado da diagonal (c jk = c k j). 

A segunda matriz que usamos para descrever as variancias e a dos desvios-pa- 
droes amostrais: 








a/? 

0 . 

.. 0 


D(s) = 

0 

^ . 

.. 0 

(12.4) 


0 

0 . 

•• a/^~_ 








D(s) e uma matriz diagonal cujos elementos sao todos 0, exceto aqueles na 
diagonal principal. Os elementos “nao zero” sao os desvios-padroes amostrais de 
cada Yj. 

Por ultimo, precisamos de uma matriz de correla<;oes amostrais: 
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’ 1 

r 12 

•• r u 


p= 

r 2,l 

1 . 

•• r 2,n 

(12.5) 



r n,2 ■ 

.. 1 



Nesta, cada elemento r jk e a correlate amostral (ver Capitulo 9, Equate 
9.19) entre as variaveis Y- e Y k . Como a correlate de uma variavel com ela mesma 
e = 1, os elementos da diagonal de P sao iguais a 1. Assim como a de variancia e 
covariancia, a matriz de correlates e simetrica {r- k = r kj ). 

COMPARANDO MEDIAS MU LTIVARI ADAS 

Comparando medias multivariadas de duas amostras: 

Teste T 2 de Hotelling 

Apresentamos os conceitos de analise multivariada atraves de uma simples ex- 
tensao do teste -1 univariado para o caso multivariado. O teste -1 classico e usado 
para testar a hipotese nula de que o valor medio de uma unica variavel nao di- 
fere entre dois grupos ou populates. Por exemplo, poderiamos testar a simples 
hipotese de que a altura do jarro da Darlingtonia californica (Tabela 12.1) nao 
difere entre populates amostradas em Day’s Gulch (DG) e no charco T.J.Howell 
(TJH). Em cada local, 25 plantas foram amostradas de forma aleatoria, das quais 
primeiro calculamos a altura media (DG = 618,8 mm; T)H = 610,4 mm) e o 
desvio-padrao (DG = 100,6 mm; TJH = 83,7 mm). Com base no teste-f padrao, 
as plantas dessas duas populates nao diferem significativamente quanto a altura 
(f = 0,34, com 48 graus de liberdade, P - 0,74). Poderiamos fazer testes-f adicio- 
nais para cada uma das variaveis na Tabela 12.1 com ou sem corre^oes para testes 
multiplos (ver Capitulo 10). Entretanto, estamos mais interessados em perguntar 
se a morfologia geral das plantas - quantificada como um vetor de medias de 
todas as variaveis morfologicas tomadas em conjunto - difere entre os dois lo- 
cais. Em outras palavras, desejamos testar a hipotese nula de que os veto res das 
medias dos dois grupos sao iguais. 

O teste T 2 de Hotelling (Hotelling, 1931) e uma generaliza^ao do teste-f 
univariado para dados multivariados. Primeiramente, calculamos as medias de 
cada grupo para cada uma das variaveis de interesse Yj e as juntamo^entao, 
em dois vetores coluna de medias (ver Equato 12.2), Y, (para TJH) e Y 2 (para 
DG). Note que um vetor-coluna e simplesmente um vetor-linha que foi trans- 
posto - as colunas e linhas sao intercambiadas. As regras da algebra de matri- 
zes, explicadas no Apendice, as vezes requerem que os vetores sejam colunas 
unicas, ou por vezes requerem que os vetores sejam linhas unicas. Mas os dados 
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sao os mesmos, independente de quando sao representados como vetores-linha 
ou vetores-coluna. 

Para este exemplo, temos sete variaveis morfologicas: altura do jarro, aber- 
tura da boca, larguras do tubo e da quilha, comprimento e envergadura das asas 
do apendice cauda de peixe na boca do jarro (Tabela 12.1), cada uma medida em 
dois locais. 



610,0 


618,8 



31,2 


33,1 



19,9 


17,9 


Y,= 

6,7 

y 2 = 

5,6 

(12.6) 


61,5 


82,4 



59,9 


79,4 



77,9 


84,2 



Por exemplo, a media da altura do jarro em TJH foi 610,0 mm (o primeiro 
elemento de Y,), enquanto a media da abertura da boca do jarro em DG foi 33,1 
mm (o segundo elemento de Y 2 ). A proposito, as variaveis usadas em uma analise 
multivariada nao tern que ser necessariamente medidas nas mesmas unidades, 
embora muitas analises multivariadas redimensionam as variaveis em unidades 
padronizadas, como descrito mais aidante, neste capitulo. 

Agora, precisamos de alguma medida de varia<;ao. Para o teste-f, usamos 
as variancias das amostras (s 2 ) de cada grupo. Para o teste T de Hotelling, 
empregamos a matriz C de variancia e covariancia amostral (Equa^ao 12.3) 
para cada grupo. A matriz de variancia e covariancia das amostras para o local 
TJH e: 


7011,5 

284,5 

32,3 

-12,5 

137,4 

691,7 

76,5 

284,5 

31,8 

-0,7 

-1,9 

55,8 

77,7 

66,3 

32,3 

-0,7 

5,9 

0,6 

-19,9 

-6,9 

-13,9 

-12,5 

-1,9 

0,6 

1,1 

-0,9 

-3,0 

-5,6 

137,4 

55,8 

-19,9 

-0,9 

356,7 

305,6 

397,4 

691,7 

77,7 

-6,9 

-3,0 

305,6 

482,1 

511,6 

76,5 

66,3 

-13,9 

-5,6 

397,4 

511,6 

973,3 


Essa matriz resume todas as variancias e covariancias amostrais das variaveis. 
Por exemplo, em TJH, a variancia amostral da altura do jarro foi 7011,5 mm 2 , 
enquanto a covariancia amostral entre altura e abertura da boca do jarro foi 284,5 
mm 2 . Embora uma matriz de variancia e covariancia amostral possa ser cons- 
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truida para cada grupo (C, e C 2 ), o teste T de Hotelling assume que essas duas 
matrizes sao aproximadamente iguais e usa a matriz C p> que e a estimativa combi- 
nada da covariancia dos dois grupos: 


c _ [(m 1 -l)C 1 + (m 2 -l)C 2 ] 

(12.8) 

P (m l +m 2 - 2) 

onde m, e m 2 sao os tamanhos amostrais de cada grupo (aqui, m l 

= m 2 = 25). 

A estatistica T 2 de Hotelling e calculada como: 


t2 _ m l m 2 (Y 1 — Y 2 ) T Cp -1 (Yj- Y 2 ) 

(12.9) 

(m,+ m 2 ) 



onde Yj e Y 2 sao os vetores de medias (Equa<;ao 12.2), C p e a matriz combinada de 
variancia-covariancia amostral (Equa^ao 12.8), o sobrescrito T denota a transpo- 
si 9 ao da matriz, e o sobrescrito (-1) denota a inversao da matriz (ver o Apendi- 
ce). Note que nesta equa^ao existem dois tipos de multiplica^ao. O primeiro e a 
multiplica^ao de matrizes dos vetores de diferen 9 as entre medias e do inverso da 
matriz de covariancia: 

(Y, — Y 2 ) T C p _1 (Y, — Y 2 ) 

O segundo e a multiplica^ao escalar desse produto pelo dos tamanhos amos- 
trais m,m 2 . 

Seguindo as regras de multiplica^ao de matrizes, a Equa^ao 12.9 da o T 2 como 
um escalar, ou um unico mimero. Uma transforma^ao linear do T 2 produz a fa¬ 
miliar estatistica teste F: 


(m i + m 2 — n — l)T 
(m, + m 2 — l)n 


( 12 . 10 ) 


onde n e o mimero de variaveis. Sob a hipotese nula de que os vetores de medias 
das populates de cada grupo sao iguais (i. e., ptj = jx 2 ), o F esta distribuido 
como uma variavel aleatoria F, com n graus de liberdade no numerador e(m,+ 
m 2 - n - 1) para o denominador. Entao, o teste de hipotese procede da maneira 
usual (ver Capitulo 5). Para as sete variaveis morfologicas, o T 2 e igual a 84,62, 
com 7 graus de liberdade no numerador e 42 no denominador. A aplica^ao da 
Equa^ao 12.10 da um valor de F de 10,58. O valor crltico de F com 7 graus de 
liberdade no numerador e 42 no denominador e igual a 2,23, o que e muito me- 
nor que o valor de 10,58 observado. Portanto, podemos rejeitar a hipotese nula 
(com um valor de P de 1,3 x 10" ) de que os dois vetores de medias das popula¬ 
tes, jX| e |x 2 , sao iguais. 
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Comparando medias multivariadas de mais de duas amostras: 
uma MANOVA simples 

Se desejarmos comparar medias univariadas para mais de duas amostras de 
grupos de tratamento, usamos ANOVA em vez do teste-f padrao. Similar- 
mente, se estamos comparando medias multivariadas para mais de dois gru¬ 
pos, usamos uma ANOVA multivariada, ou MANOVA, em vez do teste T 2 de 
Hotelling. Como no teste T 2 de Hotelling, temos; = 1,..., ate n variaveis ou 
medidas tomadas de cada individuo e i = 1,..., ate um total de m total de ob¬ 
servances. Na MANOVA, contudo, temos k = 1 ate g grupos, e l = 1,..., ate q ob¬ 
servances dentro de cada grupo. As observances multivariadas (Equanao 12.1) 
sao denotadas como y kl , o /-esimo vetor de observances dentro do k-e simo 
grupo. Se o nosso delineamento e balanceado, de modo que exista o mesmo 
numero q de observances em cada um dos g grupos, entao o nosso tamanho 
amostral total m = gq. 

Por analogia com a ANOVA de um fator (Capitulo 10, Equanao 10.6), anali- 
samos o modelo: 


Y = \l + A k + e kl (12.11) 

onde Yea matriz de medidas (com m linhas de observances e n colunas de va¬ 
riaveis), |ul e a media (geral) da populanao, A t ea matriz de desvios do fc-esimo 
tratamento para a media geral das amostras e e w e o termo do erro - a diferenna 
da media do fc-esimo tratamento do /-esimo individuo daquele grupo de trata¬ 
mento. Assume-se que o e kl provem de uma distribuinao multivariada normal 
(ver proxima senao). O procedimento e basicamente o mesmo da ANOVA de um 
fator (Capitulo 10), exceto que, em vez de comparar as medias dos grupos, com- 
paramos os centroides dos grupos - as medias multivariadas. 2 A hipotese nula e 
que as medias dos grupos de tratamento sao todas iguais: in, = |x 2 = jjl 3 =••• = 1^- 
Como na ANOVA, a estatistica do teste e a razao da soma dos quadrados entre 
grupos, dividida pela soma dos quadrados dentro dos grupos, os quais sao cal- 
culados diferentemente na MANOVA, como descrito abaixo. Essa razao tern uma 
distribuinao-F (ver Capitulo 10). 


2 Em um espa<;o unidimensional, duas medias podem ser comparadas como a diferenna aritmeti- 
ca entre elas, que e o que uma ANOVA faz para dados univariados. Em um espa^o bidimensional, 
o vetor medio de cada grupo pode ser plotado como um ponto (X, F)em um grafico cartesiano. 
Esses pontos representam os centroides (em geral pensados como o centro de gravidade de uma 
nuvem de pontos) e podemos calcular a distancia geometrica entre eles. Por fim, em um espa^o 
com tres (ou mais) dimensoes, o centroide pode novamente ser localizado por um conjunto 
de coordenadas cartesianas com uma coordenada para cada dimensao no espa^o. A MANOVA 
compara as distancias entre esses centroides e testa a hipotese nula de que as distancias entre os 
centroides dos grupos nao sao mais diferentes das esperadas devido a amostragem aleatoria. 
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As matrizes sqpc Em uma ANOVA, as somas dos quadrados sao simples nu- 
meros; em uma MANOVA, as somas dos quadrados sao matrizes - chamadas de 
matrizes de somas dos quadrados e produtos cruzados (SQPC). Sao matrizes 
quadradas (numero igual de linhas e colunas) cujos elementos da diagonal cor- 
respondem as somas dos quadrados para cada variavel e os elementos fora da 
diagonal, as somas dos produtos cruzados para cada par de variaveis. As matrizes 
SQPC sao diretamente analogas as de variancia-covariancia amostrais (Equa^ao 
12.3), porem, precisamos de tres delas. 

A matriz SQPC entre grupos e a H: 

H = q£(% - Y)(Y fc - Y ) T (12.12) 

*=i 


Na Equa^ao 12.12, o Y h e o vetor de medias das amostras no grupo k das q 
observances naquele grupo: 

y 1 = 1 

e o Y e o vetor de medias das amostras de todos os grupos-tratamento: 

i z ‘i 

y = ;-I 2 >« 

KC i k =1 1=1 


A matriz SQPC dentro de grupos e a matriz E: 

g q 

a 

k=l 1= 1 


E = li(y H -Y t )(y a -Y t .) 1 


(12.13) 


com Y k novamente sendo o vetor de medias das amostras do grupo-tratamento 
k. Em uma analise univariada, o analogo do H na Equa^ao 12.12 e a soma dos 
quadrados entre grupos (Equa^ao 10.2, Capitulo 10), e o analogo de E na Equa^ao 
12.13 e a soma dos quadrados dentro de grupos (Equa^ao 10.3, Capitulo 10). Por 
fim, calculamos a matriz SQPC total: 

T=li(y„ —Y.)(y H -Y) T (12.14) 

k =1 /=1 


EstatIsticas do teste Quatro estatlsticas-teste sao geradas a partir das matrizes 
H e E: lambda de Wilk, tra<;o de Pillai, tra«;o de Hotelling-Lawley e maior raiz de 
Roy (ver Scheiner, 2001). Todas sao calculadas como a seguir: 
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E 

Lambda de Wilk = A = . , 

E + H 


onde 11 denota o determinante de uma matriz (ver Apendice). 


A ; ' 


Tra 90 de Pillai = ^ — l — = trap [(E + H) -1 H 

i=A X i +l 1 


onde s e o menor valor entre qualquer um dos dois, ou os graus de liberdade 
(numero de grupos g - 1) ou o numero de variaveis n, X, e o i-esimo autovalor de 
E _1 H, e tra^o e o tra^o de uma matriz (ver Apendice). 

Tra^o de Hotelling-Lawley = ^ A f - = tra$o [e -1 h| 

i=l 


e 


Maior raiz de Roy = 0 = 


A 

+ 1 


onde A,, e o maior (primeiro) autovalor de E _1 H. 

Para tamanhos amostrais grandes, o lambda de Wilk, o tra^o de Ho¬ 
telling-Lawley e o tra^o de Pillai convergem para o mesmo valor de P, embora 
o tra^o de Pillai seja o mais clemente as violates de pressupostos, como a 
normalidade multivariada. A maioria dos programas ira dar todas essas esta- 
tisticas-teste. 

Cada uma dessas quatro estatisticas-teste pode ser transformada em uma 
estatistica-F e testada como na ANOVA. Contudo, seus graus de liberdade nao 
sao os mesmos. O lambda de Wilk, o tra^o de Pillai e o tra^o de Hotelling-La¬ 
wley sao calculados a partir de todos os autovalores e, entao, tern um tamanho 
amostral de nm (numero de variaveis n x numero de amostras m) com n (g- 1) 
graus de liberdade no numerador (geo numero de grupos). A maior raiz de 
Roy usa apenas o primeiro autovalor, entao seus graus de liberdade no numera¬ 
dor sao apenas n. Os graus de liberdade para o lambda de Wilk com frequencia 
sao fracionarios, e a estatistica-F associada e apenas uma aproxima^ao (Harris, 
1985). A escolha entre essas estatisticas de teste da MANOVA nao e crucial. Elas 
em geral dao resultados muito similares, como na analise dos dados da Darling- 
tonia (Tabela 12.2). 


ComparaqOes entre grupos Assim como na ANOVA, se a MANOVA da resul¬ 
tados significativos, voce pode estar interessado em determinar quais grupos em 
particular diferem uns dos outros. Para compara^oes a posteriori, o teste T 2 de 
Hotelling com o valor critico ajustado usando a corre^ao de Bonferroni (ver Capi- 
tulo 10) pode ser usado para cada compara^ao par-a-par. A analise discriminante 
(descrita posteriormente neste Capitulo) tambem pode ser usada para determi¬ 
nar quao bem os grupos podem ser separados. 
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TABELA 12.2 

Resultados de uma MANOVA de um fator 




I. Matriz H 


Altura 

Boca 

Tubo 

Quilha 

Asal 

Asa2 

Envergadura 

Altura 

35.118,38 

5.584,16 

-1.219,21 

-2.111,58 

17.739,19 

11.322,59 

18.502,78 

Boca 

5.584,16 

1.161,14 

-406,04 

-395,59 

2.756,84 

1.483,22 

1.172,86 

Tubo 

-1.219,21 

-406,04 

229,25 

127,10 

-842,68 

-432,92 

659,62 

Quilha 

-2.111,58 

-395,59 

127,10 

142,49 

-1.144,14 

-706,07 

-748,92 

Asal 

17.739,19 

2.756,84 

-842,68 

-1.144,14 

12.426,23 

9.365,82 

10.659,12 

Asa2 

11.322,59 

1.483,22 

-432,92 

-706,07 

9.365,82 

7.716,96 

8.950,57 

Envergadura 

18.502,78 

1.172,86 

659,62 

-748,92 

10.659,12 

8.950,57 

21.440,44 

II. Matriz E 


Altura 

Boca 

Tubo 

Quilha 

Asal 

Asa2 

Envergadura 

Altura 

834.836,33 

27.526,88 

8.071,43 

1.617,17 

37.125,87 

46.657,82 

18.360,69 

Boca 

27.526,88 

2.200,17 

324,05 

-21,91 

4.255,27 

4.102,43 

3.635,34 

Tubo 

8.071,43 

324,05 

671,82 

196,12 

305,16 

486,06 

375,09 

Quilha 

1.617,17 

-21,91 

196,12 

265,49 

-219,06 

-417,36 

-632,27 

Asal 

37.125,87 

4.255,27 

305,16 

-219,06 

31.605,96 

28.737,10 

33.487,39 

Asa2 

46.657,82 

4.102,43 

486,06 

-417,36 

28.737,10 

39.064,26 

41.713,77 

Envergadura 

18.360,69 

3.635,34 

375,09 

-632,27 

33.487,39 

41.713,77 

86.181,61 

III. Estatisticas-teste 

Estatistica 


Valor 

F 

gl no 

numerador 

gl no denominador 

Valor de P 

Tra^o de Pillai 


1,11 

6,45 

21 

231 

3 x 10~ 14 

Lambda de Wilk 

0,23 

6,95 

21 

215,91 

3 x 10~ 15 

Tra^o de Hotelling-Lawley 

2,09 

7,34 

21 

221 

3 x 10~ 16 

Maior autovalor de Roy 

1,33 

14,65 

7 


77 

5 x 10' 12 


Os dados originais sao medidas de 7 variaveis morfologicas em 89 individuos do lirio-cobra, Darlingtonia californica co- 
letadas em 4 locais (Tabela 12.1). H e a matriz (SQPC) de somas dos quadrados entre grupos e dos produtos cruzados. Os 
elementos da diagonal sao as somas dos quadrados de cada variavel, os elementos externos a diagonal sao as somas dos 
produtos cruzados para cada par de variaveis (Equa^ao 12.12). A matriz H e analoga ao calculo univariado da soma dos 
quadrados entre grupos (Equa^ao 10.2). A matriz E e a de SQPC dentro de grupos. Os elementos da diagonal sao os desvios 
internos de grupos de cada variavel, os elementos externos a diagonal sao os residuos dos produtos cruzados para cada par 
de variaveis (Equa^ao 12.13). A matriz E e analoga ao calculo univariado da soma dos quadrados dos residuos (Equa^ao 
10.3). Nessas matrizes, partimos da boa pratica de reportar apenas digitos significativos a fim de evitar erros de arredonda- 
mento em nossos calculos. Se fossemos reportar esses dados em uma publica^ao cientifica, eles nao teriam mais digitos sig¬ 
nificativos do que tivemos em nossas medidas (ver Tabela 12.1). As quatro estatisticas-teste (tra^o de Pillai, lambda de Wilk, 
tra^o de Hotelling-Lawley e maior raiz de Roy) representam maneiras diferentes de testar as diferen^as entre os grupos em 
uma analise de variancia multivariada (MANOVA). Todas essas medidas geraram valores de P muito pequenos, sugerindo 
que os vetores de 7 elementos das medidas morfologicas da Darlingtonia diferem significativamente entre os locais. 
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Todos os delineamentos de ANOVA descritos no Capitulo 10 tem analogos 
diretos na MANOVA, quando as variaveis respostas sao multivariadas. A unica di- 
feren<;a e que as matrizes SQPC sao usadas em vez das somas dos quadrados entre 
e dentro de grupos. Pode ser dificil calcular matrizes SQPC para delineamentos 
experimentais complexos (Harris, 1985; Hand & Taylor, 1987). Scheiner (2001) 
resume tecnicas de MANOVA para ecologos e cientistas da area ambiental. 

Pressupostos da manova Alem dos pressupostos usuais da ANOVA (observa¬ 
nces sao amostradas independente e aleatoriamente, os erros dentro dos grupos 
sao iguais entre eles e tem distribui^ao normal), a MANOVA tem dois pressupos¬ 
tos adicionais. Primeiro, semelhante aos requerimentos do teste T 2 de Hotelling, 
as covariancias sao iguais entre os grupos (o pressuposto da esfericidade). Segun- 
do, as variaveis multivariadas usadas na analise e os termos do erro e kl na Equa^ao 
12.11 devem se conformar a uma distribui<;ao normal multivariada. Na proxima 
se^ao, descrevemos a distribu^ao normal multivariada e como testar os desvios 
dessa distribui<;ao. 

Como o tra^o de Pillai e robusto a violates modestas desses pressupos¬ 
tos, na pratica, a MANOVA e valida se os dados nao desviam substancialmen- 
te da esfericidade ou da normalidade multivariada. A Analise de Similaridade 
(ANOSIM) e um metodo alternativo a MANOVA (Clarke & Green, 1988; Cla¬ 
rke, 1993), que nao depende da normalidade multivariada, mas pode ser usado 
apenas para delineamentos de um fator e totalmente cruzados, ou em deline¬ 
amentos com dois fatores aninhados. A ANOSIM tem menos poder (alta pro- 
babilidade de erro estatistico do Tipo II) na presen^a de gradientes fortes nos 
dados (Somerfield et al., 2002). 

A DISTRIBUKA0 NORMAL MULTIVARIADA 

A maioria dos metodos multivariados para teste de hipoteses requer que os 
dados analisados se ajustem a uma distribuinao normal multivariada (ou 
multinormal). A distribuinao normal multivariada e analoga da distribui<;ao 
normal (ou gaussiana) para a variavel multidimensional Y = [ Yp Y 2 , YJ. 
Como vimos no Capitulo 2, a distribuiqao normal tem dois parametros: p (a 
media) e a 2 (a variancia). Em contraste, a distribui<;ao normal multivariada 3 e 


_ (Continua) 

3 A fun^ao de densidade de probabilidade para uma distribui^ao normal multivariada assume um 
vetor aleatorio tt-dimensional Y de variaveis aleatorias [Y p Y n \ com vetor de medias jjl = [\i v 
|Lij e matriz de variancia e covariancia 
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definida pelo vetor de medias p, e pela matriz de covariancia Z. O numero de 
parametros na distribui^ao normal multivariada depende do de variaveis alea- 
torias Y, em Y. Como se sabe, uma distribui^ao normal unidimensional tern 
uma curva em forma de sino (ver Figura 2.6). Para uma variavel bidimensional 
Y = [Y p Y 2 \, a distribui^ao normal bivariada parece com um sino ou chapeu 
(Figura 12.1). A maioria da massa de probabilidade esta concentrada perto do 
centro do chapeu, o mais proximo das medias das duas variaveis. Conforme 
movemos em qualquer dire^ao para a aba do chapeu, a densidade de probabi¬ 
lidade se torna cada vez mais fina. Embora seja dificil desenhar uma distribui- 
^ao multivariada para variaveis de mais de duas dimensoes, podemos calcular 
e interpreta-las da mesma maneira. 

Para a maioria dos objetivos, e conveniente usar a distribui^ao normal multi¬ 
variada padronizada, que tern um vetor de medias (Jt = [0]. A distribui^ao normal 
bivariada ilustrada na Figura 12.1 e, na verdade, uma distribui^ao normal biva¬ 
riada padronizada. Tambem podemos ilustrar essa distribui<;ao como um grafico 
de contorno (Figura 12.IE) de elipses concentricas. A elipse central corresponde 
a uma fatia do pico da distribui<;ao e, conforme descemos no chapeu, as fatias 
elipticas se tornam mais largas. Quando todas as variaveis Y n em Y sao indepen- 
dentes e nao correlacionadas, todos os coeficientes de correla^ao fora da diagonal 
r mn na matriz de correla^ao P sao = 0, e as fatias elipticas sao perfeitamente cir¬ 
culars. Contudo, as variaveis na maioria dos conjuntos de dados multivariados 
sao correlacionadas. Portanto, as fatias em geral tern forma eliptica, como na 
Figura 12.IE. Quanto mais forte a correla^ao entre um par de variaveis, mais 
prolongados sao os contornos da elipse. A ideia pode ser estendida para mais de 
duas variaveis em Y e, neste caso, as fatias seriam elipsoides ou hiperelipsoides no 
espa^o multidimensional. 

Teste de normalidade multivariada 

Varios testes multivariados assumem que os dados multivariados ou que seus 
residuos tenham distribui<;ao normal multivariada. Os testes para normalidade 
univariada (descritos no Capitulo 11) sao usados rotineiramente com regressao, 


3 ( Continua^ao) 

na qual o~ e a variancia de Y e y ;/ e a covariancia de Y e Y. Para este vetor Y, a fun^ao densidade de 
probabilidade para a distribui^ao normal multivariada e 

1 f — t( Y—Jl ) T X -1 (Y-p. )1 

f(Y) = ^—=e [ J 

Ver o Apendice para detalhes sobre determinantes (| |), inversos (matrizes elevadas a potencia (-1)) 
e transposi<;ao (T) de matrizes. O numero de parametros necessarios para definir uma distribui^ao 
normal multivariada e 2 n + n(n - l)/2, onde neo numero de variaveis em Y. Note como essa equa- 
<;ao se parece com a fun<;ao de densidade de probabilidade para a distribui^ao normal univariada 
(Nota de Rodape 10, Capitulo 2, e Tabela 2.4). 
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Figura 12.1 Exemplode uma distribui^ao normal multivariada. A variavel aleatoria multivariada Xeum 
vetor de duas variaveis univariadas, X, e X 2 , cada uma com 5.000 observances: X = [X,, X 2 ]. 0 vetor de medias 
(JL = [0,0], pois ambos X, e X 2 tern medias = 0.0 desvio-padrao tanto de X, quanto de X 2 e = 1 , uma vez que 


a matriz D(s) dos desvios-padroes amostrais = 


1 

0 


0 

1 


. (A, B) Esses histogramas ilustram as distributees de 


frequencia de X, (A) e X 2 (B). A correlanao entre X, e X 2 = 0,75 e e ilustrada no grafico de dispersao (C). Assim, 


a matriz P das correlates amostrais = 


1 

0,75 


0,75 

1 


. A distribui^ao de probabilidade multivariada conjunta 


de X e apresentada como urn grafico de rede em (D). Essa distribui^ao tambem pode ser representada como 
urn grafico de contorno (E), onde cada contorno representa uma fatia atraves do grafico de rede. Assim, para 
X, e X 2 proximos de 0, a marca do contorno = 0,2 significa que a probabilidade conjunta de se obter esses 
dois valores e aproximadamente 0,2. A dire^ao e a excentricidade das elipses (ou fatias) do contorno refle- 
tem a correla^ao entre as variaveis X, e X 2 (painel C). Se X, e X 2 fossem completamente nao correlacionados, 
oscontornos seriam circulares. SeX, eX 2 fossem correlacionados, os contornos iriam colapsarem uma unica 
linha reta no espa^o bivariado. 
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ANOVA e outras analises estatisticas univariadas, mas testes para normalidade 
multivariada raras vezes sao realizados. Isso nao e pela falta de disponibilidade 
desses testes. De fato, mais de cinquenta desses testes de normalidade multiva¬ 
riada foram propostos (revisao em Koizol, 1986; Gnanadesikan, 1997; e Mecklin 
8c Mundfrom, 2003). No entanto, esses testes nao estao incluidos nos pacotes de 
programas estatisticos, e ate hoje nao foi encontrado nenhum que leve em conta 
o grande numero de formas com que os dados multivariados podem desviar da 
normalidade (Mecklin 8c Mundfrom, 2003). Como esses testes sao complexos, e 
geralmente dao resultados confidantes, eles tern sido chamados de “curiosidades 
academicas, pouco usados por estatisticos praticantes” (Horswell, 1990, citado em 
Mecklin 8c Mundfrom, 2003). 

Um atalho comum e simples para testar a normalidade multivariada e verifi- 
car se cada variavel individual dentro do conjunto de dados multivariado tern dis- 
tribui<;ao normal (ver o Capitulo 11 para detalhes). Se qualquer uma das variaveis 
individuais nao tiver distribui^ao normal, entao nao e possivel que o conjunto 
de dados multivariado tenha uma distribui^ao normal multivariada. Contudo, o 
contrario nao e verdadeiro. Cada medida univariada pode ter distribui^ao nor¬ 
mal, mas o conjunto de dados inteiro ainda assim pode nao ter uma distribui^ao 
normal multivariada (Looney, 1995). Os testes adicionais para normalidade mul¬ 
tivariada devem ser feitos mesmo se cada variavel individual tiver distribuic^ao 
normal univariada. 

Um teste para normalidade multivariada baseia-se em medidas multivariadas 
de assimetria e curtose (ver Capitulo 3). Esse teste foi desenvolvido por Mardia 
(1970) e estendido por Doornik 8c Hansen (1994). Os calculos envolvidos no teste 
de Doornik 8c Hansen sao comparativamente simples e o algoritmo e fornecido 
por completo no artigo destes autores de 1994. 4 

Testamos os dados de Darlingtonia (Tabela 12.1) para a normalidade mul¬ 
tivariada usando o teste de Doornik 8c Hansen. Apesar de todas as medidas 


4 A extensao de Doornik 8c Hansen (1994) e mais acurada (da o erro Tipo I esperado nas simula¬ 
tes) e tern um poder estatistico melhor do que o teste de Mardia tanto para tamanhos amostrais 
pequenos (50 > N > 7) quanto grandes (N > 50) (Doornik 8c Hansen, 1994, Mecklin 8c Mundfrom, 
2003). Tambem e mais facil de entender e programar do que o procedimento alternativo descrito por 
Royston (1983). 

Para um conjunto de dados multivariado com m observa^oes e n medidas, a estatistica do 
teste de Doornik 8c Hansen, E n , e calculada como E n = Zj Z 1 + Z\ Z 2 , onde Z t e um vetor coluna 
M-dimensional de assimetria transformada dos dados multivariados eZ 2 e um vetor coluna n- di¬ 
mensional de curtose transformada dos dados multivariados. As transforma^oes sao dadas em 
Doornik 8c Hansen (1994). A estatistica teste E n e distribulda assintoticamente como uma variavel 
aleatoria x com 2« graus de liberdade. (AME escreveu uma fun^ao em S-Plus/R para realizar o 
teste de Doornik 8c Hansen. O codigo pode ser baixado em http://harvardforest.fas.harvard.edu/ 
personnel/web/aellison. ) 
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individuais terem distribute) normal (P > 0,5 para todas variaveis, usando o 
teste de bondade do ajuste de Kolmogorov-Smirnov), os dados multivariados 
pouco desviaram da normalidade multivariada (P = 0,006). Essa falta de ajuste 
foi consequencia da medida da largura da quilha do tubo. Removendo essa va¬ 
riavel, os dados remanescentes passaram no teste de normalidade multivariada 
(P = 0,07). 

MEDIDAS DE DISTANCIA MULTIVARIADA 

Varios metodos multivariados quantificam a diferen^a entre observances indi¬ 
viduais, amostras, grupos de tratamentos ou populates. Essas diferen^as com 
frequencia sao expressas como distancias entre observances no espa^o multi- 
variado. Antes de mergulharmos nas tecnicas analiticas, descrevemos como as 
distancias sao calculadas entre observances individuais ou entre os centroides 
que representam as medias de grupos inteiros. Usando os dados amostrais da 
Tabela 12.1, poderiamos perguntar: quao distante (ou diferentes) duas plantas 
individuais sao uma da outra no espano multivariado criado usando as varia¬ 
veis morfologicas? 

Medindo distancias entre dois individuos 

Vamos comenar considerando apenas dois individuos, planta 1 e planta 2, da Ta¬ 
bela 12.1, e duas das variaveis, altura do jarro (variavel 1) e envergadura do seu 
apendice cauda de peixe (variavel 2). Para essas duas plantas, poderiamos medir a 
distancia morfologica entre elas plotando os pontos em duas dimensoes e medin¬ 
do a menor distancia entre eles (Figura 12.2). Essa distancia, obtida aplicando o 
teorema de Pitagoras/ e chamada de distancia eudidiana e e calculada como: 


5 Pitagoras de Samos (ca. 569-475 a.C.) deve ter sido o primeiro matematico “puro”. Ele e mais bem 

lembrado por ser o primeiro a oferecer uma prova formal do que agora 
e conhecido como o Teorema de Pitagoras: a soma dos quadrados dos 
catetos de um triangulo reto e igual ao quadrado do comprimento da 
sua hipotenusa: a 2 + b 2 = c. Note que a distancia euclidiana que estamos 
usando e o comprimento da hipotenusa de um triangulo reto implici- 
to (ver Figura 12.2). Pitagoras tambem sabia que a Terra era esferica e, 
embora a colocando no centro do universo, ele errou sua posi^ao por 
alguns bilhoes de anos-luz da sua posi^ao real. 

Pitagoras fundou uma sociedade cientifico-religiosa em Crotona, 
atualmente sul da Italia. A panelinha dessa sociedade (que incluia ho- 
mens e mulheres) era constituida os mathematikoi , comunitarios que 
renunciaram as posses pessoais e eram estritamente vegetarianos. Entre as suas cren^as fundamen- 
tais estava a de que a realidade e natureza matematica, que essa filosofia e a base da purifica^ao 
espiritual, que a alma pode obter a uniao com o divino e que alguns simbolos tern significado mis- 
tico. Todos os membros da ordem eram jurados para lealdade e segredo maximos, por isso dados 
biograficos sobre Pitagoras sao escassos. 
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Figura 12.2 Em duas dimensoes, a distancia eudidiana e aquela em linha reta entre os pon- 
tos. Neste exemplo, as duas variaveis morfologicas que medimos sao a altura da planta e a enverga- 
dura do apendice da extremidade do li'rio-cobra carnivora, Darlingtonia californica (Tabela 12.1). 
Aqui, as medidas para duas plantas individuals sao plotadas no espa^o bivariado. A Equa^ao 12.15 
e usada para calcular a distancia eudidiana entre elas. 





,i /;,i) 2+ (y«,2 yjx> 2 


(12.15) 


Na Equa^ao 12.15, a planta e indicada pela letra subscrita i ou j, e a variavel 
pelo subscrito 1 ou 2. Para calcular a distancia entre as medidas, elevamos ao qua- 
drado a diferen^a entre as alturas, somamos a isto o quadrado da diferen^a das 
envergaduras e tiramos a raiz quadrada dessa soma. O resultado para essas duas 
plantas e a distancia d t) = 241,05 mm. Como as variaveis originais foram medidas 
em milimetros, quando subtraimos uma medida de outra, nosso resultado ainda 
esta em milimetros. Aplicando as operates subsequentes de elevar ao quadrado, 
somar e tirar a raiz quadrada traz de volta uma medida de distancia que ainda esta 
nas unidades de milimetros. Entretanto, as unidades de medidas de distancia nao 
permanecerao as mesmas, a menos que todas as variaveis originais forem medidas 
nas mesmas unidades. 

Similarmente, podemos calcular a distancia eudidiana entre essas duas plan¬ 
tas se elas forem descritas por tres variaveis: altura, envergadura e diametro da 
boca (Figura 12.3). Apenas adicionamos outra diferen 9 a elevada ao quadrado - 
neste caso, existente entre os diametros da boca - a Equa<;ao 12.15: 









418 Nicholas J. Gotelli e Aaron M. Ellison 



Figura 12.3 Medindo a distancia eudidiana em um espa^o tridimensional. 0 diametro da boca 
foi adicionado as duas variaveis morfologicas mostradas na Figura 12.2, e as tres variaveis sao plo- 
tadas no espago tridimensional. A Equa^ao 12.16 e usada para calcular a distancia eudidiana, que 
e 241,58. Note que essa distancia e virtualmente identica a eudidiana medida em duas dimensoes 
(241,05, Figura 12.2). A razao e que a terceira variavel (diametro da boca) tern media e variancia 
muito menores que as duas primeiras variaveis, e entao nao afeta muito a medida de distancia. 
Por essa razao, as variaveis devem ser padronizadas (usando a Equa^ao 12.17) antes de calcular a 
distancia entre indivi'duos. 



r,,i - Yj, i ) 2 +(/i ,2 - y j ,2 ) 2 +(/i,3 - Yj, 3 ) 2 


( 12 . 16 ) 


O resultado da aplica<;ao da Equa^ao 12.16 as duas plantas e uma distancia 
morfologica de 241,58 mm - uma mera mudan^a de 0,2% da distancia obtida 
usando apenas as duas variaveis altura e envergadura. 

Por que essas duas distancias euclidianas nao sao muito diferentes? Pois a 
magnitude da altura da planta (centenas de milimetros) e muito maior que a 
magnitude tanto da envergadura quanto do diametro da boca (dezenas de mili¬ 
metros), a medida da altura da planta domina os calculos da distancia. Na pratica, 
portanto, e essencial padronizar as variaveis antes de calcular distancias. Uma pa- 
droniza^ao conveniente e transformar cada variavel subtraindo sua media amos- 
tral do valor de cada observa<;ao daquela variavel, e entao dividir essa diferen<;a 
pelo desvio-padrao amostral: 
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O resultado dessa transforma^ao e chamado escore-Z. Seu papel e contro- 
lar as diferen^as em cada variavel medida e tambem comparar medidas que 
nao estao nas mesmas unidades. Os valores padronizados (escores-Z) da Tabela 
12.1 sao dados na Tabela 12.3. A distancia entre essas duas plantas para as duas 
variaveis padronizadas, altura e envergadura, e 2,527, e para as tres variaveis 
padronizadas, altura, envergadura e diametro da boca, e 2,533. A diferen^a ab- 
soluta entre essas duas distancias e de modestos 1%. Contudo, essa diferen^a e 
cinco vezes maior que a existente entre as distancias calculadas com os dados 
nao padronizados. 

Quando os dados foram transformados com os escores-Z, quais sao as uni¬ 
dades de distancia? Se estivessemos trabalhando com as variaveis originais, as 
unidades seriam em milimetros. Mas variaveis padronizadas sempre sao adimen- 
sionais. A Equa^ao 12.17 fornece unidades de mm x mm" , que se cancelam. Nor- 
malmente, pensamos nos escores-Z como parte de unidades de “desvios-padroes” 
- quantos desvios padroes uma medida esta da media. Por exemplo, uma planta 
com uma medida de altura padronizada de 0,381 e 0,381 desvios-padroes maior 
do que a planta media. 

Embora nao possamos desenhar quatro ou mais eixos em uma folha de papel 
plana, podemos calcular, ainda assim, as distancias euclidianas entre dois indivi- 
duos se eles sao descritos por n variaveis. A formula geral para a distancia eucli- 
diana com base em um conjunto de n variaveis e: 



I ( y i,k y j,k ) 

k =1 


( 12 . 18 ) 


Conforme todas as 7 variaveis morfologicas padronizadas, a distancia eucli- 
diana entre as duas plantas na Tabela 12.3 e 4,346. 


TABELA 12.3 Padroniza^ao de dados multivariados 


Local Planta 

Altura 

Boca 

Tubo 

Quilha 

Asal 

Asa2 

Envergadura 

Massa 
do capuz 

Massa do 
tubo 

Massa 
da asa 

TJH 

1 

0,381 

1,202 

-1,062 

0,001 

0,516 

0,156 

-1,035 

1,568 

0,602 

0,159 

TJH 

2 

-2,014 

-1,388 

-0,878 

-0,228 

-0,802 

-1,984 

-0,893 

-0,881 

-1,281 

-0,276 

A 

A 

A 

A 

A 

A 

A 

A 

A 

A 

A 

A 


Os dados originais sao medidas de 7 variaveis morfologicas e 3 variaveis de biomassa de 89 individuos de Darlingtonia 
californica coletados em quatro locais (Tabela 12.1). As duas primeiras linhas de dados sao ilustradas apos a padroniza- 
<^ao. Os valores padronizados sao calculados subtraindo cada observa^ao da media amostral de cada variavel e dividindo 
essa diferen^a pelo desvio-padrao amostral (Equa^ao 12.17). 
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Medindo distances entre dois grupos 

Tipicamente, queremos medir distancias entre amostras ou grupos de tratamen- 
tos experimentais, nao apenas entre individuos. Podemos aplicar a formula da 
distancia euclidiana para medir essa distancia entre medias de qualquer numero 
arbitrario de grupos g: 


r M ) 2 (i2.i9) 


onde Y ik e a media da variavel i no grupo k. O Y t , na Equa<;ao 12.19, pode ser 
univariado ou multivariado. Mais uma vez, para que nenhuma variavel domine 
o calculo de distancia, em geral padronizamos os dados (Equa^ao 12.17) antes de 
calcular as medias e as distancias entre os grupos. A partir da Equa<;ao 12.19, a 
distancia euclidiana entre as populates de DG e TJH, fimdamentada em todas as 
7 variaveis morfologicas, e de 1,492 desvios-padroes. 

Outras medidas de distancia 

A distancia euclidiana e a medida mais usada. Entretanto, ela nem sempre e a 
melhor escolha para calcular o afastamento entre objetos multivariados. Por 
exemplo, uma questao comum em ecologia de comunidades e quao diferente dois 
locais sao com base na ocorrencia ou abundancia das especies encontradas nesses 
dois locais. Um paradoxo curioso e contraintuitivo e que dois locais com nenhu¬ 
ma especie em comum podem ter uma distancia euclidiana menor que outros 
dois que compartilham pelo menos algumas especies! Esse paradoxo e ilustrado 
usando dados hipoteticos (Orloci, 1978) para tres locais x p x 2 , e x 3 , e tres especies 


TABELA 12.4 Matriz local x especies 


Local 


Especies 


Yi 

y 2 

y 3 

x i 

0 

1 

1 

x 2 

1 

0 

0 

X 3 

0 

4 

4 


Essa matriz ilustra o paradoxo de se usar distancias euclidianas para medir a similaridade entre locais com 
base na abundancia de especies. Cada linha representa um local e cada coluna, uma especie. Os valores sao 
os numeros de individuos de cada especie y, no local x ; , O paradoxo e que a distancia euclidiana entre dois 
locais sem nenhuma especie em comum (como os locais e x 2 ) pode ser menor que a euclidiana entre dois 
lugares que compartilham pelo menos algumas especies (como x t e x 3 ). 
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TABELA 12.5 Distancias euclidianas par-a-par 
entre os locais 


Local 


Local 


X 1 

X 2 

X 3 

x . 

0 

1,732 

4,243 

X 2 

1,732 

0 

5,745 

X 3 

4,243 

5,745 

0 


Essa matriz baseia-se nas abundancias das especies dadas na Tabela 12.4. Cada valor na matriz correspon- 
de a distancia euclidiana entre os locais x- e x k . Note que a matriz de distancia e simetrica (ver o Apendice): 
por exemplo, a distancia entre os locais x, e x 2 e a mesma que a existente entre x 2 e x r Os elementos da dia¬ 
gonal sao todos iguais a 0, porque a distancia entre um local e ele mesmo e = 0. Essa matriz de calculos de 
distancia demonstra que as euclidianas podem dar resultados contraintuitivos se os dados contem muitos 
zeros. Os locais x, e x 2 nao partilham especies em comum, mas sua distancia euclidiana e inferior a mesma 
existente entre x x e x 3 , que compartilham o mesmo conjunto de especies. 


y,, y 2 , y 3 . A Tabela 12.4 da a matriz de locais x especies; a Tabela 12.5, todas as dis¬ 
tancias euclidianas par-a-par entre os locais. Neste exemplo simples, os locais x, e 
x, nao tern especies em comum, e a distancia euclidiana entre eles e 1,732 especies 
(Equa^ao 12.14): 


d Xi X2 = V(l-0) 1 2 3 4 +(l-0) 2 +(l-0) 2 = 1,732 

Em contraste, os locais x x e x 3 tern todas suas especies em comum (tanto y 2 
quanto y 3 ocorrem nessas duas areas), mas a distancia entre eles e 4,243 especies: 

d XiX 3 = V(0 - 0) 2 + (1 - 4) 2 + (1 - 4) 2 = 4,243 

Os ecologos, cientistas da area ambiental e estatisticos desenvolveram muitas 
outras medidas para quantificar a distancia entre duas amostras ou populates 
multivariadas. Um subconjunto desses e apresentado na Tabela 12.6, Legendre & 
Legendre (1998) e Podani & Miklos (2002) discutem muitas outras. Essas medidas 
dividem-se em duas categorias: distancias metricas e distancias semi-metricas. 
As distancias metricas tern quatro propriedades: 

1. A distancia minima e = 0, e se dois objetos (ou amostras) x, e x 2 sao identicos, 
entao a distancia d entre eles tambem e igual a 0: x, = x 2 => d(x v x 2 ) = 0. 

2. A medida de distancia d e sempre positiva se dois objetos (x, e x 2 ) nao sao 
identicos: x, ^ x 2 => d(x p x 2 ) > 0. 

3. A medida de distancia d e simetrica: d(x,,x 2 ) = d(x 2 ,x l ). 

4. A medida de distancia d satisfaz a desigualdade triangular: para tres objetos 
x„ x 2 e x 3 , d(x ,,x 2 ) + d(x 2 ,x 3 ) > d(x p x 3 ). 
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TABELA 12.6 

Algumas medidas comuns de distancia ou dissimilaridade usadas por 
ecologos 

Nome 

Formula 

Propriedade 

Euclidiana 

d i,j= JX(n*- y h k) 2 

n=i 

Metrica 

Manhattan 
(ou City Block) 

1 

II 

Metrica 


Corda 


Mahalanobis 



v = -* --Km,- - DC,-+(m, - 1)C,] 

m: + m: —2 


Metrica 


Metrica 


Chi-quadrado 


Bray-Curtis 


Jaccard 

Sorensen 



XK*: - ^ | 


4i= — 

n 


2 <**+ yp t) 


fc=i 


: = - 

>; fl + fc + C 

, fl + fe 

a,, =--- 

a + b + 2c 


Metrica 


Semimetrica 


Metrica 

Semimetrica 


As distancias euclidiana, de Manhattan (ou City Block), de Corda, e de Bray-Curtis sao usadas principalmente para 
dados numericos continuos. As de Jaccard e Sorensen sao usadas para medir o afastamento entre duas amostras que sao 
descritas por dados de presen^a e ausencia. Nas de Jaccard e Sorensen, aeo numero de objetos (p. ex., especies) que ocor- 
rem apenas em y {> be o numero de objetos que ocorrem apenas emy-eceo numero de objetos que ocorre em ambos, 
em y i e em y.. A distancia de Mahalanobis se aplica apenas para grupos de amostras y f e y., em que cada um contem m i e 
m j amostras, respectivamente. Na equa^ao da distancia de Mahalanobis, deo vetor de diferen<;as entre as medias das m 
amostras em cada grupo, V e a matriz conjunta de variancia e covariancia amostral dentro de grupos, calculada como 
demonstrado, e C, e a matriz de variancia e covariancia amostral para y, (Equa<;ao 12.3). 
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As distancias euclidiana, de Manhattan, de Chord, de Mahalanobis, chi qua- 
drado e de Jaccard 6 sao exemplos de distancias metricas. 

As distancias semimetricas satisfazem apenas as tres primeiras dessas proprie- 
dades, mas podem violar a desigualdade triangular. As medidas de Bray-Curtis e 
de Sorensen sao semimetricas. Um terceiro tipo de medida de distancia, nao usa- 


6 Se voce ja tiver usado o indice similaridade de Jaccard, pode perguntar por que nos referimos a ele 
na Tabela 12.6 como uma medida de distancia ou dissimilaridade. O coeficiente de Jaccard (1901) 
foi desenvolvido para descrever quao similares duas comunidades sao em termos de especies com- 
partilhadas s- ; 

c 

1,7 a + b + c 


onde a e o numero de especies que ocorrem apenas na comunidade i,be o numero de especies 
que ocorre apenas na comunidade j, eceo numero de especies que elas tern em comum. Como 
as medidas de similaridade assumem seu valor maximo quando os objetos sao mais similares, e 
as medidas de dissimilaridade (ou distancia) assumem seu valor maximo quando os objetos sao 
mais diferentes, qualquer medida de similaridade pode ser transformada em uma medida de dis¬ 
similaridade ou distancia. Se uma medida de similaridade s varia de 0 a 1 (como o coeficiente de 
Jaccard), ela pode ser transformada em uma medida de distancia d usando umas das tres equates 
a seguir: 

d-\ — s,d- Vl —5,ou d = Vl — s 2 


Deste modo, na Tabela 12.6, a distancia de Jaccard e igual a 1 - o coeficiente de similaridade de Jac¬ 
card. A transforma^ao reversa (p. ex., s = 1 - d) pode ser usada para transformar medidas de distancia 
em medidas de similaridade. Se a medida de distancia nao e delimitada (i. e., varia de 0 a °o), ela deve 
ser normalizada para variar entre 0 e 1: 


d = ^ ou d = — ^ min 

M'nnrm - VJU 


^max ^min 


Embora essas propriedades algebricas dos indices de similaridade sejam simples, suas proprie- 
dades estatisticas nao sao. Indices de similaridade, como usados na biogeografia e ecologia de comu¬ 
nidades, sao muito sensiveis a varia^ao no tamanho amostral (Wolda, 1981; Jackson et al., 1989). Em 
particular, pequenas comunidades podem ter coeficientes de similaridade relativamente altos mesmo 
na ausencia de qualquer for^a biotica incomum, porque suas faunas sao dominadas por um punhado 
de especies comuns e com ampla distribui^ao. Especies raras sao encontradas principalmente em 
faunas maiores, e elas tenderao a reduzir o indice de similaridade entre duas comunidades mesmo 
que as especies raras tambem ocorram de forma aleatoria. Os indices de similaridade e outros in¬ 
dices bioticos deveriam ser comparados a um modelo nulo apropriado que controle a varia^ao no 
tamanho amostral ou o numero de especies presente (Gotelli & Graves, 1996). Tanto simulates de 
Monte Carlo quanto calculos de probabilidade podem ser usados para determinar o valor esperado 
de um indice de biodiversidade ou similaridade em pequenos tamanhos amostrais (Colwell 8c Co- 
ddington, 1994; Gotelli & Colwell, 2001). A similaridade medida na composi^ao de especies de duas 
assembleias depende nao apenas do numero de especies que elas compartilham, mas do potencial 
de dispersao das especies (a maioria dos modelos simples assume que as ocorrencias das especies 
sao equiprovaveis), e da composi^ao e do tamanho do pool de especies (Connor 8c Simberloff, 1978; 
Rice 8c Belland, 1982). Alternativamente, Legendre 8c Gallagher (2001) sugerem transforma^oes que 
reduzem a influencia das especies raras nesses tipos de compara^oes. 
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da por ecologos, e a nao metrica, que viola a segunda propriedade das distancias 
metricas e pode assumir valores negativos. 

0RDENA(A0 

As tecnicas de ordena^ao sao usadas para ou ordenar dados multivariados. A 
ordena^ao cria novas variaveis (chamadas eixos principals), atraves das quais 
as amostras recebem escores ou sao colocadas em ordem. Esse ordenamento 
pode representar uma simplifica^ao util de padroes em conjuntos de dados 
multivariados complexos. Usada dessa maneira, a ordena^ao e uma tecnica de 
redu^ao de dados: come^ando com um conjunto de n variaveis, gera um nu- 
mero menor de variaveis que, ainda assim, ilustram os padroes importantes 
nos dados. A ordena^ao tambem pode ser usada para discriminar ou separar 
amostras ao longo de eixos. 

Os ecologos e cientistas da area ambiental muitas vezes usam cinco tipos dife- 
rentes de ordena^ao - analise de componentes principals, fatorial, de correspon¬ 
dence, de coordenadas principals e escalonamento multidimensional nao me- 
trico - que discutiremos em separado. Avaliamos profundamente os detalhes da 
analise de componentes principals, porque os conceitos e metodos sao similares 
aqueles usados em outras tecnicas de ordena«;ao. Nossa discussao sobre os outros 
quatro metodos e um pouco breve. Legendre & Legendre (1998) e um bom guia 
ecologico para os detalhes da analise multivariada. 

Analise de componentes principals 

A analise de componentes principals (Principal Component Analysis - PCA) e a 
maneira mais simples para ordenar dados. A ideia da PCA geralmente e creditada 
a Karl Pearson (1901), 7 o renomado Pearson do chi-quadrado e da correla^ao, 
porem Harold Hotelling 8 (do teste T 2 de Hotelling) desenvolveu os metodos com- 
putacionais em 1933. O uso basico da PCA reduz a dimensionalidade de dados 
multivariados. Em outras palavras, usamos a PCA para criar algumas poucas va- 


7 O objetivo de Pearson no seu artigo de 1901 era determinar a atribui<;ao racial de individuos com 
base em multiplas medidas biometricas. Ver , na Nota de Rodape 3, Capitulo 11, um esbo<;o biografico 
de Karl Pearson. 

s Harold Hotelling (1895-1973) contribuiu significativamente para a estatisti- 
ca e para a economia, dois campos dos quais os ecologos surrupiaram muitas 
ideias. Seu artigo de 1931 estendendo o teste-t para casos multivariados tambem 
introduziu os intervalos de confian^a para os estatisticos, e o seu artigo de 1933 
desenvolveu a matematica dos componentes principals. Como economista, ele 
era mais conhecido por defender abordagens com base em custos e beneficios 
marginais - a tradi^ao neoclassica na economia fundamentada no Manual da 
Economia Politica de Vilfredo Pareto. Essa tradi<;ao tambem forma a base para 
Harold Hotelling varios modelos de otimiza^ao do balan^o ( trade-offs ) ecologico e evolutivo. 
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riaveis-chave (onde cada uma e composta de muitas de nossas variaveis originais) 
que caracterizem o maximo possivel a varianao em um conjunto de dados mul- 
tivariado. O atributo mais importante da PCA e que as novas variaveis nao sao 
correlacionadas umas com as outras. Essas variaveis nao correlacionadas podem 
ser usadas na regressao multipla (Capitulo 9) ou na ANOVA (Capitulo 10) sem 
temer a multicolinearidade. Se as variaveis originais tern distribui«;ao normal, ou 
tiverem sido transformadas (Capitulo 8) ou padronizadas (Equanao 12.17) antes 
da analise, as novas variaveis resultantes da PCA tambem terao distribui^ao nor¬ 
mal, satisfazendo um dos requerimentos basicos dos testes parametricos que sao 
usados para testar hipoteses. 

Pca: o conceito A Figura 12.4 ilustra o conceito basico de uma analise de com- 
ponentes principals. Imagine que voce contou o numero de individuos de duas 
especies de tico-tico-do-campo em cada uma de dez parcelas de pradaria. Esses 
dados podem ser plotados em um grafico no qual a abundancia da Especie A esta 
no eixo-x e a da Especie B, no eixo-y. Cada ponto no grafico representa os dados 
de uma parcela diferente. Agora, criamos uma nova variavel, ou primeiro eixo 
principal, 9 que passa atraves do centro da nuvem de dados. Em seguida, calcula- 
mos um valor para cada uma das dez parcelas ao longo desse novo eixo, e entao 
o representamos. Para cada ponto, esse calculo usa os numeros da Especie A e da 
Especie B, gerando um unico novo valor, que e o escore do componente princi¬ 
pal no primeiro eixo principal. Embora os dados multivariados originais tenham 
duas observances para cada parcela, o escore do componente principal reduz essas 
duas observances para um unico numero. Efetivamente, reduzimos a dimensio- 
nalidade dos dados de duas dimensoes (abundancia da Especie A e da Especie B) 
para uma dimensao (primeiro eixo principal). 

Em geral, se voce mediu de j = 1 a n variaveis Y- para cada replica, pode gerar 
n novas variaveis Z-, que sao todas nao correlacionadas umas com as outras (todos 
os elementos fora da diagonal em P = 0). Fazemos isso por duas razoes. Primeiro, 
como os Z. nao sao correlacionados, cada um deles pode ser imaginado como me- 
dindo uma “dimensao” diferente e independente dos dados multivariados. Note 
que essas novas variaveis nao sao as mesmas que os escores-Z descritos acima 
(Equanao 12.17). 

Segundo, as novas variaveis podem ser ordenadas com base na quantidade 
de varianao que elas explicam nos dados originais. Entao, Z x tern a maior quanti¬ 
dade de varianao nos dados (e e chamado eixo maior), Z 2 tern a proxima maior 


9 0 termo “eixo principal” e derivado da optica e e usado para se referir a linha (tambem conhecida 
como eixo optico) que passa atraves do centro da curvatura de uma lente, de modo que um raio de 
luz passando ao longo dessa linha nao e nem refletido nem refratado. Tambem e usado na fisica para 
se referir a um eixo de simetria, em que um objeto ira rotacionar em uma velocidade angular cons- 
tante sobre o seu eixo principal, sem a aplica^ao de torque adicional. 
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(A) 



Primeiro eixo principal 


Figura 12.4 Construgao de um eixo de componente principal. (A) Para um conjunto hipotetico 
de 10 parcelas de pradaria, o numero de indivi'duos de duas especies de tico-tico-do-campo e 
medido em cada parcela. Cada uma pode ser representada como um ponto em um grafico de 
dispersao bivariado com a abundancia de cada especie representada nos dois eixos. 0 primeiro 
eixo principal (linha verde) passa atraves do maior eixo de varia^ao dos dados. 0 segundo compo¬ 
nente principal (pequena linha preta) e ortogonal (perpendicular) ao primeiro e explica a pequena 
quantidade de varia^ao residual nao incorporada anteriormente no primeiro eixo principal. (B) 0 
primeiro eixo principal e entao rotacionado, se tornando o novo eixo ao longo do qual os escores 
das parcelas sao colocados em ordem (ordenados). A linha preta vertical indica a intersegao do 
segundo eixo principal. Pontos a direita da linha vertical tern escores positivos no primeiro eixo 
principal, e pontos a esquerda da linha vertical tern escores negativos. Apesar de os dados originais 
multivariados terem duas medidas para cada parcela, a maioria da varia^ao nos dados e capturada 
por um unico escore no primeiro componente principal, permitindo que as parcelas sejam orde- 
nadas ao longo desse eixo. 


quantidade de varia^ao nos dados, e assirn por diante (var(Z,) > var(Z 2 ) >... > 
var (ZJ). Em um tipico conjunto de dados ecologico, a maioria da varia^ao nos 
dados e capturada pelos primeiros Z, e podemos descartar os subsequentes, que 
explicam a varia^ao residual. Ordenados dessa maneira, os Z- sao chamados com- 
ponentes principais. Se a PCA e informativa, reduz um grande numero de va¬ 
riaveis originais correlacionadas para um pequeno numero de variaveis novas e 
nao correlacionadas. 

A analise de componentes principais e bem-sucedida na medida em que 
existem fortes intercorrela<;6es nos dados originais. Se no comedo todas as va¬ 
riaveis nao sao correlacionadas, nao ganhamos nada com a PCA, pois nao po¬ 
demos capturar a varia^ao em um punhado de variaveis novas e transforma- 
das; podemos, sim, basear a analise nas proprias variaveis nao transformadas. 
Alem disso, a PCA nao sera bem-sucedida se empregada em variaveis nao pa- 
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dronizadas. A padroniza^ao e necessaria para a mesma escala relativa, usando 
transforma^oes como a da Equa^ao 12.17, de modo que os eixos da PCA nao 
sejam dominados por uma ou duas variaveis que tenham grandes unidades de 
medida. 

Um exemplo de uma pca Entao como e que funciona? A titulo de exemplo, va- 
mos examinar alguns dos resultados de uma PCA aplicada aos dados de Dar- 
lingtonia na Tabela 12.1. Para esta analise, usamos todas as dez variaveis - altura, 
abertura da boca, diametros do tubo e da quilha, comprimento e envergadura 
das asas do apendice cauda de peixe, e massas do capuz, do tubo e do apendice - 
que chamaremos de Y, a Y 10 . O primeiro componente principal, Z,, e uma nova 
variavel (nao entre em panico, os detalhes virao a seguir) cujo valor para cada 
observa^ao e: 


Z, = 0,31 Y, + 0,407,-0,00273-0,1874 + 0,397 5 + 0,377 6 + 0,26Y 7 + 0,407 g + 0,387, + 0,237, 0 (12.20) 


Geramos o escore do primeiro componente principal (Z,) para cada planta 
individual multiplicando cada variavel medida vezes o coeficiente correspondente 
(a carga) e somando os resultados. Deste modo, multiplicamos 0,31 vezes a altura 
da planta, mais 0,40 vezes o diametro da abertura da boca, e assim por diante. 
Para a primeira replica da Tabela 12.1, Z, = 1,43. Como os coeficientes para alguns 
dos Y j podem ser negativos, o escore do primeiro componente para uma replica 
particular pode ser positivo ou negativo. A variancia de Z, e = 4,49 e explica 46% 
da varia<;ao total nos dados. Os segundo e terceiro componentes principais tern 
variancias de 1,63 e 1,46, e a de todos os outros e < 0,7. 

De onde veio a Equa<;ao 12.20? Note primeiro que Z, e uma combina^ao 
linear das dez variaveis Y. Como descrevemos acima, multiplicamos cada variavel 
Yj por um coeficiente a y , tambem conhecido como carga (loading em ingles), e 
somamos todos esses produtos para obter o Z,. Cada componente principal adi- 
cional e outra combina^ao linear de todos os Y-. 

Z j = a n Y l + a i2 Y 2 + ••• + a in Y n (12.21) 


Os a~ sao os coeficientes para o fator i que sao multiplicados pelo valor da 
variavel j medido. Cada componente principal explica tanta varia^ao nos dados 
quanto possivel, sujeito a cond^ao de que todos os Zj nao sejam correlaciona- 
dos. Essa condi^ao garante que os Z j sejam independentes e ortogonais. Portanto, 
quando plotamos os Zj, estamos vendo relates (se houver alguma) entre varia¬ 
veis independentes. 

Calculando componentes principais Tanto o calculo dos coeficientes a ijy quan¬ 
to o de suas variancias associadas e relativamente simples. Come<;amos padroni- 
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zando nossos dados, aplicamos a Equa^ao 12.17 e entao calculamos a matriz C 
de variancia e covariancia das amostras (Equa^o 12.3) dos dados padronizados. 
Note que C calculada usando os dados padronizados e a mesma da matriz de cor- 
rela«;ao P (Equa<;ao 12.5) usando dados brutos. 

Calculamos, entao, os autovalores X.,... X„ da matriz de variancia e covariancia 
amostral e seus autovetores, a-, associados (ver o Apendice para os metodos). O 
;-esimo autovalor e a variancia de Z, e as cargas a i} sao os elementos dos autoveto¬ 
res. A soma de todos os autovalores e a variancia total explicada: 


n 



e a propor^ao da variancia explicada por cada componente Z- e: 


var- = 



Se multiplicarmos var ( por 100, obtemos a porcentagem de varia<;ao expli¬ 
cada. Como existem tantos componentes principals quantas forem as variaveis 
originais, a quantidade total de varia<;ao explicada por todos os componentes 
principals e = 100%. Os resultados desses calculos para os dados da Darlingtonia 
na Tabela 12.1 sao resumidos nas Tabelas 12.7 e 12.8. 

Quantos componentes usar? Como a PCA e um metodo para simplificar 
dados multivariados, estamos interessados em reter apenas aqueles compo¬ 
nentes que explicam a maior parte da varia<;ao nos dados. Nao existe nenhum 
ponto de corte absoluto a partir do qual descartamos os componentes princi¬ 
pals, mas uma ferramenta grafica util para examinar a contribui^ao de cada 
componente principal para toda a PCA e um scree plot (Figura 12.5). Esse 
grafico ilustra a porcentagem de varia^ao (o autovalor) em ordem decrescente 
explicada por cada componente. O scree plot parece o perfil de uma montanha 
abaixo com bastante pedregulho (conhecido como inclina^ao de pedreira). Os 
dados usados para construir o scree plot estao tabulados na Tabela 12.7. Em 
um scree plot, procuramos por uma curva abrupta ou uma mudan<;a na in- 
clina^ao dos autovalores ordenados. Retemos aqueles componentes que con- 
tribuem para o lado da montanha e ignoramos o cascalho no fundo. Neste 
exemplo, os Componentes 1-3 parecem uteis, explicando um total de 77% da 
varia«;ao, enquanto os Componentes 4-10 parecem apenas cascalho, e nenhum 
deles explica mais que 7% da varia<;ao restante. Jackson (1993) discute uma 
ampla variedade de metodos heurlsticos (como o scree plot ) e estatisticos para 
escolher quantos componentes principals usar. Seus resultados sugerem que os 
scree plots tendem a superestimar em 1, o numero de componentes principals 
estatisticamente significantes. 
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TABELA 12.7 Autovalores da analise de componentes principals 


Componente 

principal 

Autovalor A,, 

Propor^ao de 
variancia explicada 

Propor^ao cumulativa de 
variancia explicada 

z, 

4,51 

0,458 

0,458 

Z 2 

1,65 

0,167 

0,625 

Z 3 

1,45 

0,148 

0,773 

Z 4 

0,73 

0,074 

0,847 

Z 5 

0,48 

0,049 

0,896 

Z 6 

0,35 

0,036 

0,932 

Z 7 

0,25 

0,024 

0,958 

Z 8 

0,22 

0,023 

0,981 

z 9 

0,14 

0,014 

0,995 

Zio 

0,05 

0,005 

1,000 


Esses autovalores foram obtidos da analise das medidas padronizadas de 7 variaveis morfologicas e 3 variaveis 
de biomassa de 89 individuos do lirio-cobra Darlingtonia californica coletadas em 4 locais (Tabela 12.3). Em 
uma analise de componentes principais, o autovalor mede a propor^ao de variancia dos dados originais expli- 
cada por cada componente principal. A propor^ao de variancia explicada e a propor^ao cumulativa explicada 
sao calculadas a partir da soma dos autovalores (£X ; = 9,83). A propor^ao de variancia explicada e usada para 
selecionar um pequeno numero de componentes principais que captura a maioria da varia^ao nos dados. Neste 
conjunto, os tres primeiros componentes principais explicam 77% da variancia nas 10 variaveis originais. 


TABELA 12.8 Autovetores de uma analise de componentes principais 


' 0,31 " 


-0,42 ' 


0,17 ' 

0,40 


-0,025 


-0,11 

-0,002 


-0,10 


-0,74 

-0,18 


-0,07 


-0,58 

0,39 

0,37 

*2 = 

0,28 

0,37 

a 3 = 

- 0,004 

0,09 

0,26 


0,43 


0,19 

0,40 


-0,18 


-0,08 

0,38 


-0,41 


0,04 

0,23 


0,35 


0,11 


Os primeiros tres autovetores da analise de componentes principais das medidas da Tabela 12.1. Cada elemento 
no autovetor e o coeficiente (ou carga) que e multiplicado pelo valor da variavel padronizada correspondente 
(Tabela 12.3). Os produtos das cargas e das medidas padronizadas sao somados para dar o escore do compo¬ 
nente principal. Desse modo, usando o primeiro autovetor, 0,31 e multiplicado pela primeira medida (altura 
da planta) e adicionado a 0,40, multiplicado pela segunda medida (diametro da boca da planta), e assim por 
diante. Na nota<;ao de matrizes, dizemos que os escores dos componentes principais Z } para cada observa^ao y, 
que consiste de dez medidas y l atey 10 , sao obtidos multiplicando a, por y {ver Equates 12.20 a 12.23). 
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0,458 



Componente 


Figura 12.5 Um scree plot para a analise de componentes principais dos dados padronizados 
da Tabela 12.3. Em um scree plot, a porcentagem de variancia (o autovalor) explicada por cada 
componente (Tabela 12.7) e apresentada em ordem decrescente. 0 scree plot parece o perfil de 
uma montanha abaixo, de onde muito pedregulho desmoronou (inclinagao de pedreira). Nesse 
scree plot, o Componente 1 daramente domina o lado da montanha, embora os Componentes 2 e 
3 tambem sejam informativos. 0 restante e cascalho. 


O que os componentes significam? Agora que selecionamos um pequeno nu- 
mero de componentes, queremos examina-los com mais detalhes. O Componente 
1 ja foi descrito na Equa^ao 12.20: 


Z, = 0,31 T, + 0,40 Y 2 - 0,002Tj - 0,18T 4 + 0,39 Y 5 + 0,37Y 6 + 0,26Y 7 + 0,40Y 8 + 0,38 Y 9 + 0,23Y lc 


Esse componente e a matriz produto do primeiro autovetor a, (Tabela 12.8) 
e a matriz de observances multivariadas Y que foi padronizada usando a Equa- 
nao 12.17. A maioria das cargas (ou coeficientes) e positiva, e todas possuem 
aproximadamente a mesma magnitude, exceto as duas cargas das variaveis re- 
lacionadas ao tubo da folha (diametro do tubo Y 3 e diametro da quilha Y 4 ). 
Assim, este primeiro componente parece ser uma boa medida do “tamanho” 
do jarro - plantas com jarros altos, bocas largas e grandes apendices irao ter 
maiores valores de Z,. 

Similarmente, o Componente 2 e o produto entre segundo autovetor a 2 (Ta¬ 
bela 12.8) e a matriz de observanoes padronizadas Y: 


Z 2 =-0,42Y, — 0,25 Y 2 — 0,10Y, -0,07Y 4 + 0,28Y 5 + 0,37Y 6 + 0,43 Y 1 - 0,18Y 8 - 0,41 Y 9 + 0,35 Y 10 (12.22) 






















Prindpios de Estati'stica em Ecologia 431 


Para esse componente, as cargas das seis variaveis relacionadas a altura e 
ao diametro do jarro sao negativas, enquanto as cargas das quatro variaveis 
relacionadas ao apendice cauda de peixe sao positivas. Como todas as variaveis 
foram padronizadas, os jarros relativamente pequenos e finos terao valores 
negativos de altura e diametro, enquanto os relativamente altos e entroncados 
terao valores positivos de altura e diametro. O valor de Z 2 por consequencia 
reflete trade-offs na forma. As plantas pequenas e com grandes apendices terao 
grandes valores de Z 2 , enquanto as altas com pequenos apendices terao valores 
pequenos de Z 2 . Podemos pensar em Z 2 como uma variavel que descreve a 
“forma” do jarro. Geramos os escores do segundo componente principal para 
cada planta individual substituindo de novo seus valores observados y x a y l0 na 
Equa^ao 12.22. 

Por fim, o Componente 3 e o produto entre o terceiro autovetor a 3 (Tabela 
12.8) e a matriz de observances padronizadas Y: 


Z 3 = 0,17V, - 0,11V, + 0,74Yj + 0,58 V 4 - 0,004V 5 + 0,09V 6 + 0,19V 7 - 0,08 Y g + 0,04V, + 0,11 V |0 (12.23) 


Esse componente e significativamente dominado por grandes coeficientes 
positivos para os diametros do tubo (Y 3 ) e da quilha (Y 4 ) - medidas de estru- 
turas que sustentam o jarro. O Z 3 sera grande para plantas “gordas” e pequeno 
para as “magras”. Como os insetos sao capturados dentro do tubo, as plantas 
com grandes escores Z 3 podem ser capazes de pegar presas maiores do que as 
com escores menores. 

Todas as cargas sAo significativas? Ao criar os escores dos componentes 
principals, usamos as cargas de todas as variaveis originais. Mas algumas sao 
maiores e outras sao proximas de zero. Devemos usar todas ou apenas aquelas 
que estao acima de algum valor de corte? Existe pouco consenso neste ponto 
(Peres-Neto et al., 2003) e se a PCA e usada apenas para analise exploratoria 
de dados, provavelmente nao importa muito se pequenas cargas sao retidas ou 
nao. Mas se voce usa os escores dos componentes principals para testar hipote- 
ses, deve declarar explicitamente quais cargas foram usadas, e como decidiu por 
inclui-las ou exclui-las. Se voce esta testando intera^oes entre os eixos principals, 
e importante reter todas. 

Usando os componentes para testar hipOteses Por fim, podemos querer exa- 
minar diferen^as entre os quatro locais em seus escores dos componentes prin¬ 
cipals. Podemos ilustrar essas diferennas plotando os escores dos componentes 
principals de cada planta em dois eixos, e codificar os pontos (= replicas) para 
cada grupo usando diferentes cores ou simbolos (Figura 12.6). Neste grafico, 
ilustramos os escores dos dois primeiros componentes, Z, e Z 2 . Poderiamos 
construir graficos similares para os outros componentes principals significati- 
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Figura 12.6 Grafico ilustrando os escores dos dois primeiros componentes principals de uma 
PCA dos dados naTabela 12.3.Cada ponto representa uma planta individual as cores representam 
os diferentes locais nas montanhas Siskiyou, do sul de Oregon. Embora exista uma sobreposi^ao 
consideravel entre os grupos, tambem ha alguma separa^ao nitida: as amostras deTJH (verde-claro) 
tern escores mais baixos no componente principal 2, e as amostras de HD (pretas), no primeiro com¬ 
ponente principal.Testes univariados ou multivariados podem ser usados para comparar os escores 
dos componentes principals entre as populates (ver Figura 12.7). 

vos (p. ex., Z, versus Z 3 ; Z 2 versus Z 3 ). A Figura 12.6 foi gerada usando todas as 
cargas das Equates 12.20 e 12.22. 

Uma caracteristica importante da PCA e que as posi^oes dos escores dos 
componentes principals para cada replica (como os pontos na Figura 12.6) tern 
a mesma distancia euclidiana entre si que os dados originais no espaijo multi- 
variado. Essa propriedade se mantem apenas quando as distancias euclidianas 
sao calculadas usando todos os componentes principals (Z-). Se voce calcular as 
distancias euclidianas usando apenas alguns dos primeiros componentes prin¬ 
cipal, elas nao serao iguais as distancias entre os pontos dos dados originais. 
Se os dados foram originalmente coletados com informa^ao espacial (como as 
coordenadas x,y , ou de latitude e longitude, onde os dados foram coletados), os 
escores do componentes principais podem ser plotados contra suas coordena¬ 
das espaciais. Tais graficos podem dar informa^oes sobre as relates espaciais 
multivariadas. 

Podemos tratar os escores dos componentes principais como uma variavel 
univariada simples e usar ANOVA (Capitulo 10) para testar as diferen^as entre 
grupos de tratamento ou populates de amostras. Por exemplo, uma ANOVA 
dos escores do primeiro componente principal dos dados de Darlingtonia da 
um resultado de que existem diferen^as significativas entre os locais (F 3 79 = 9,26, 
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P = 2 x KT), e de que todas as diferen^as entre pares de locais, exceto para a com- 
paraqao entre DG e LEH, tambem sao significativamente diferentes (ver Capitulo 
10 para detalhes dos calculos de compara^oes a posteriori). Concluimos que o 
tamanho da planta varia sistematicamente entre locais (Figura 12.7). 

Obtemos resultados similares para a forma da planta (F 3 79 = 5,36, P - 0,002), 
mas apenas tres das compara 9 oes par-a-par - DG versus TJH, HD versus TJH 
eLEH versus TJH - sao significativamente diferentes. Esse resultado sugere que 
plantas do TJH tern uma forma diferente das de outros locais. A concentra^ao de 
pontos verde-claro (os escores dos componentes principals para plantas de TJH) 
na Figura 12.6 revela que essas plantas tern escores mais baixos para o segundo 
componente principal - ou seja, sao relativamente altas com apendices cauda de 
peixe pequenos. 

Analise fatorial 

A analise fatorial 10 e a PCA tern um objetivo similar: a redu^ao de muitas varia- 
veis para poucas variaveis. Enquanto a PCA cria novas variaveis como combina- 
^oes lineares das variaveis originais (Equa^ao 12.21), a analise fatorial considera 
cada uma das variaveis originais como uma combina^ao linear de alguns “fatores” 
subjacentes. Voce pode pensar nisso como uma PCA inversa: 

Y j = a i\ F \ + a i2 F 2 + • • • + a in F n + e j ( 12 - 24 ) 


Para usar esta equa^ao, as variaveis Y- devem ser padronizadas (media = 0, 
variancia = 1) usando a Equa^ao 12.17. Cada a V} e uma carga do fator, os F sao 
chamados de fatores comuns (e cada um tern media = 0e variancia = 1), e os e- 
sao fatores especificos da j-esima variavel, que, alem disso, nao sao correlaciona- 
dos com nenhum F-> e cada um com media = 0. 


10 A analise fatorial foi desenvolvida por Charles Spearman (1863-1945). No 
seu artigo de 1904, Spearman usou a analise fatorial para medir a inteli- 
gencia geral a partir da pontua^ao em testes multiplos. O modelo fatorial 
(Equa^ao 12.24) foi usado para a parti^ao dos resultados de uma bateria de 
“testes de inteligencia” (os Y-) em fatores (os F-) que mediam a inteligencia 
geral a partir de fatores especificos a cada teste (os e } ). Esta descoberta duvi- 
dosa forneceu os fundamentos teoricos para os testes gerais de inteligencia 
de Binet (testes de quociente de inteligencia, ou QI). As teorias de Spearman 
foram usadas para desenvolver os exames britanicos Plus-Elevens , que foram 
administrados em estudantes aos 11 anos de idade no intuito de determi- 
nar se eles estariam aptos a frequentar uma universidade ou uma escola tecnica ou vocacional. 
Os testes padronizados em todos os niveis (p. ex., MCAT, SAT e GRE, nos Estados Unidos) sao o 
legado dos trabalhos de Spearman e Binet. O livro The mismeasure of man* (1981), de Stephen Jay 
Gould, descreve a historia repugnante dos testes de QI e o uso de medidas biologicas a servi^o da 
opressao social. 



Charles Spearman 


* N. de T. Titulo em portugues: A falsa medida do homem. 
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Figura 12.7 Box plots dos escores do primeiro componente principal de uma PCA dos dados 
daTabela 12.3. Cada box plot representa um dosquatro locais especificados na Figura 12.6. A linha 
horizontal indica a mediana da amostra, e a caixa engloba 50% dos dados, do 25° ao 75° percentil. 
Os"bigodes"(barras) englobam 90% dos dados, do 10° ao 90° percentil. Quatro pontos de dados 
extremos (alem de 5° e 95° percentis) estao apresentados como barras horizontais para o local LEH. 
Os escores do Componente Principal 1 variaram de maneira significativa entre os locais (F 3 79 = 9,26, 
P = 2x10‘ 5 ), e foram mais baixos (e menos variaveis) em HD (ver Figura 12.6). 


Sendo uma “PCA inversa”, a analise fatorial geralmente come^a com uma PCA 
e usa os componentes significativos como os fatores iniciais. A Equa^ao 12.21 nos 
deu a formula para gerar componentes principals: 

Z j = a i\ Y \ + a Q Y 2 + ... + a in Y n 

Como a transforma^ao de Y para Z e ortogonal, existe um conjunto de coefi- 
cientes a- tal que: 


Y j = a] l Z 1+ a- a Z 2 + ... + alZ n (12.25) 

Para uma analise fatorial, mantemos apenas os primeiros m componentes, 
como aqueles determinados como importantes em uma PCA usando um scree 
plot: 


Y • — ci •, Zy + u -)Z~y + ... + a ■ Z ~\~e~ 

j il 1 i2 2 tm m j 


(12.26) 
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Para transformar os Z, em fatores (que sao padronizados com variancia = 
1), dividimos cada um deles pelo seu desvio-padrao, a raiz quadrada do seu 
autovalor correspondente. Isso nos da um modelo fatorial: 

Y j = b n F l + b i2 F 2 + ... + b im F m + e j (12.27) 

onde Fj = /^Jx~ e b- = 

Rotacionando os fatores Diferente dos Z i gerados pela PCA, os fatores F ; na 
Equa<;ao 12.27 nao sao unicos, e mais de um conjunto de coeficientes ira resolver 
a Equa^ao 12.27. Podemos gerar novos fatores F*-, que sao combina^oes lineares 
dos fatores originals: 


F ) ~ d i\ F \ + d i2 F 2 + — + d im F m (12.28) 

Esses novos fatores tambem explicam muito da variancia dos dados, como 
os fatores originais. Depois de gerar os fatores usando as Equates 12.25 a 12.27, 
identificamos os valores para os coeficientes d n na Equa^ao 12.28, a qual apresenta 
fatores que sao mais faceis de interpretar. Esse processo de identifica^ao e chama- 
do rota^ao de fatores. 

Existem dois tipos de rota^ao de fatores: a rota^ao ortogonal, que resulta em 
novos fatores que nao sao correlacionados uns com os outros, e a rota^ao obli- 
qua, que resulta em novos fatores que podem ser correlacionados uns com os ou¬ 
tros. A melhor rota^ao e aquela em que os coeficientes do fator d i} ou sao muito 
pequenos (caso em que o fator associado e sem importancia) ou muito grandes 
(quando o fator associado e muito importante). O tipo mais comum de rota<;ao 
de fatores ortogonal e chamado rota^ao varimax, que maximiza o somatorio da 
variancia dos coeficientes dos fatores na Equa^ao 12.28: 

n 

var max = variancia maximaQT d?) 

H 

Calculando e usando os escores dos fatores Os escores dos fatores para cada 
observa^ao sao calculados como os valores dos F- para cada Y,. Como os escores 
dos fatores originais Fj sao combina^oes lineares dos dados (indo de tras para 
frente, da Equa^ao 12.27 para Equa^ao 12.25), podemos re-escrever a Equa^ao 
12.28 em nota^ao de matrizes como: 

F* = (DTD) 1 DTY (12.29) 
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ondeD eamatriz nxn doscoeficientesdosfatores d tj , Y e a dedados,eF^eados 
escores dos fatores rotacionados. Resolvendo esta equa^ao diretamente, temos os 
escores dos fatores para cada replica. 

Tenha cuidado ao realizar testes de hipoteses com os escores dos fatores. Em- 
bora possam ser uteis para descrever dados multivariados, eles nao sao unicos 
(uma vez que existem infinitamente muitas escolhas de F-), e o tipo de rota^ao 
usada e arbitrario. A analise fatorial e recomendada apenas para analise de dados 
exploratoria. 

Um breve exemplo Conduzimos uma analise fatorial com os mesmos dados 
usados para a PCA: 10 variaveis padronizadas medidas em 89 plantas de Darling- 
tonia em quatro locais, em Oregon e na California (Tabela 12.3). A analise usou 
quatro fatores, que explicaram 28%, 26%, 13% e 8%, respectivamente, ou um 
total de 75% da variancia nos dados. 11 Depois de usar a rotanao varimax e resolver 
a Equa^ao 12.29, plotamos os primeiros dois escores dos fatores para cada planta 
em um grafico de dispersao (Figura 12.8). Como a PCA, a analise fatorial sugere 
alguma discriminate entre os grupos: as plantas do local HD (simbolos pretos) 
tern baixos escores no Fator 1, enquanto as do local TJH (simbolos verdes-claros) 
tern baixos escores no Fator 2. 


Analise de coordenadas principals 

A analise de coordenadas principals (Principal Coordinates Analysis - PCoA) e 
um metodo usado para ordenar dados usando qualquer medida de distancia. A 
analise de componentes principais e a analise fatorial sao empregadas quando 
usamos dados multivariados quantitativos, e desejamos preservar as distancias 
euclidianas entre as observances. Em muitos casos, porem, as distancias euclidia- 
nas entre as observances fazem pouco sentido. Por exemplo, uma matriz binaria 
de presenna e ausencia e uma estrutura de dados muito comum em estudos eco¬ 
logies e ambientais: cada linha da matriz e um local ou uma amostra, e cada 
coluna e uma especie ou um taxon. Os valores na matriz indicam a ausencia (0) 
ou a presenna (1) de uma especie em um local. Como vimos anteriormente (Ta- 
belas 12.4 e 12.5), distancias euclidianas medidas para dados desse tipo podem 
dar resultados contraintuitivos. Outro exemplo no qual distancias euclidianas 
nao sao apropriadas e uma matriz de distancias geneticas das diferennas relativas 
em bandas de eletroforese. Em ambos, a PCoA e mais apropriada do que a PCA. 
A propria analise de componentes principais e um caso especial de PCoA: os 


11 Alguns programas de analise fatorial usam um teste da bondade do ajuste (Capitulo 11) para tes- 
tar a hipotese de que o numero de fatores usado na analise e suficiente para capturar o volume de 
variancia contra a alternativa de que mais fatores sao necessarios. Para os dados de Darlingtonia , 
uma analise da bondade do ajuste de chi-quadrado falhou em rejeitar a hipotese nula de que quatro 
fatores eram suficientes (% 2 = 17,91, 11 graus de liberdade, P = 0,084). 
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Figura 12.8 Grafico ilustrando os primeiros dois fatores resultantes de uma analise fatorial dos 
dados daTabela 12.3. Cada ponto representa uma planta individual e as cores representam os dife- 
rentes locais, como na Figura 12.6. Os resultados sao qualitativamente similares a analise de com- 
ponentes principals apresentada na Figura 12.6, com escores baixos para HD no Fator 1 e escores 
baixos para TJH no Fator 2. 


autovalores e autovetores associados de uma PCA que calculamos de uma matriz 
de variancia e covariancia tamb£m podem ser recuperados aplicando-se PCoA a 
uma matriz de distancias euclidianas. 

Calculos bAsicos em uma anAlise de coordenadas principais A analise de coor- 
denadas principais segue cinco passos: 

1. Gere uma matriz de distancia ou dissimilaridade dos dados. Essa matriz, D, 
tern elementos </„ que correspondem a distancia entre duas amostras, i e j. 
Qualquer uma das medidas de distancia dadas na Tabela 12.6 pode ser usada 
para calcular os <T. D e uma matriz quadrada, com o numero de linhas i = ao 
niimero de colunas j = ao numero de observances m. 

2. Transforme D em uma nova matriz D*, com elementos: 



Essa transforman'ao converte a matriz de distancia em uma de coordena¬ 
das que preserva a relan'ao de distancia entre as varidveis transformadas e os 
dados originais. 
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TABELA 12.9 Matriz de presen^a e ausencia usada para analise de coordenadas principais 

(PCoA), analise de correspondence (CA), e escalonamento multidimensional 
nao metrico (NMDS) 


Amblyopone Aphaenogaster Brachymyrmex Camponotus Crematogaster Dolichoderus Formica 


Connecticut 

0 

1 

0 

1 

0 

0 

0 

MA no continente 

1 

1 

1 

1 

0 

1 

1 

Ilhas de MA 

1 

0 

0 

0 

1 

1 

1 

Vermont 

0 

1 

0 

1 

0 

0 

1 


Cada linha representa amostras de diferentes localidades: Connecticut, Massachusetts (MA) no continente e em ilhas 
distantes de sua costa, e Vermont. Cada coluna representa um genero diferente de formiga coletado durante um le- 
vantamento em florestas no entorno de pequenos brejos. (Dados compilados de Gotelli & Ellison, 2002a,b, e nao 
publicados.) 


3. Centralize a matriz D* para criar a A com elementos 8 ; •, aplicando-se a se- 
guinte transforma^ao a todos os elementos de D*: 

5 tj =d; r d;-T j+ d' 


onde d ■ e a media da linha i de D*, d■ e a media da coluna; de D*, e d■ e a 
media de todos os elementos de D*. 

4. Calcule os autovalores e autovetores de A. Os autovetores z k devem ser coloca- 
dos na escala da raiz quadrada dos seus autovalores correspondentes: 




a /t a t- ~ 



5. Escreva os autovetores a. k como colunas, com cada linha correspondendo a 
uma observa^ao. Os valores sao as novas coordenadas dos objetos no espa^o 
de coordenadas principais, analogamente aos escores dos componentes prin¬ 
cipais. 


Um breve exemplo Usamos a PCoA para analisar uma matriz binaria de presen- 
9 a e ausencia de quatro locais (Connecticut, Vermont, Massachusetts no conti¬ 
nente, e Ilhas de Massachusetts) e 16 generos de formigas encontradas em flores¬ 
tas em torno de pequenos brejos (Tabela 12.9). Primeiro, geramos uma matriz de 
distancias entre os quatro locais usando a medida de dissimilaridade de Sorensen 
(Tabela 12.10). A matriz de distancias 4x4 contem os valores das medidas de 
dissimilaridade de Sorensen calculadas para todas as combina^oes par-a-par de 
locais. Entao, calculamos os autovetores, que sao usados na contagem dos escores 
das coordenadas principais para cada local. Os escores das coordenadas princi¬ 
pais para cada local estao plotados para os dois primeiros eixos de coordenadas 
principais (Figura 12.9). Os locais diferem conforme a dissimilaridade em suas 
composites de especies e podem ser ordenados com base nisso. Os locais sao 
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Lasius 

Leptothorax 

Myrmecina 

My r mica 

Paratrechina 

Prenolepis 

Ponera 

Stenamma 

Tapinoma 

1 

1 

0 

1 

0 

0 

0 

1 

1 

1 

1 

1 

1 

0 

1 

0 

1 

0 

1 

1 

1 

1 

1 

1 

0 

1 

1 

1 

1 

0 

1 

0 

0 

1 

1 

1 


ordenados CT, VT, MA no continente, ilhas de MA, da esquerda para a direita ao 
longo do primeiro eixo principal, que explica 80,3% da variancia da matriz de 
distancias. O segundo eixo principal separa, principalmente, os locais de MA no 
continente dos locais em ilhas de MA e explica uma variancia adicional de 14,5% 
da matriz de distancias. 


Analise de correspondence 

A analise de correspondencia (Correspondence Analysis - CA), tambem conheci- 
da como medias redprocas (Reciprocal Averaging - RA) (Hill, 1973) ou analise de 
gradiente indireta, e usada para examinar a rela^ao das assembleias de especies as 
caracteristicas dos locais. Os locais em geral sao selecionados para abranger um 
gradiente ambiental, e a hipotese ou o modelo subjacente e que as distributes 
das abundancias das especies sao unimodais e aproximadamente normais (ou 
gaussianas) ao longo do gradiente ambiental (Whittaker, 1956). Os eixos resul- 


TABELA 12.10 Medidas de dissimilaridade usadas na analise de coordenadas 


principais (PCoA) e no escalonamento multidimensional nao 
metrico (NMDS) 



Connecticut 

MA no continente 

Ilhas de MA 

Vermont 

Connecticut 

0 

0,37 

0,47 

0,13 

MA no continente 

0,37 

0 

0,25 

0,33 

Ilhas de MA 

0,47 

0,25 

0 

0,43 

Vermont 

0,13 

0,33 

0,43 

0 


Os dados originais consistem de uma matriz de presen^a e ausencia de generos de formigas de floresta em 
quatro locais na Nova Inglaterra (ver Tabela 12.9). Cada valor e a dissimilaridade de Sorensen entre cada 
par de locais (ver a formula na Tabela 12.6). Quanto mais dois locais diferem nos generos que eles contem, 
maior e a dissimilaridade. Por defini^ao, a matriz de dissimilaridade e simetrica e os elementos da diagonal 
iguais a 0,0. MA = Massachusetts. 
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Figura 12.9 Ordena<;ao de quatro locais de floresta com base nas suas assembleias de especies 
de formigas (Tabela 12.9) usando Analise de Coordenadas Principals (PCoA). Uma matriz de dis¬ 
tances par-a-par entre os quatro locais e calculada a partir desses dados (Tabela 12.10) e usada na 
PCoA. Os locais sao ordenados CT, VT, MA no continente, ilhas de MA da esquerda para a direita ao 
longo do primeiro eixo principal, que explica 80,3% da variancia da matriz de distances. 0 segundo 
eixo principal separa principalmente os locais MA no continente dos locais ilhas em MA, e explica 
uma variancia adicional de 14,5%. 


tantes de uma CA maximizam a separa^ao das abundancias das especies ao longo 
de cada eixo de picos. A entrada de dados para uma analise de correspondence 
e uma matriz de locais x especies que e manipulada como se fosse uma tabela de 
contingencia (ver Capitulo 11). A analise de correspondence tambem pode ser 
considerada um caso especial de PCoA, e uma PCoA usando uma matriz de dis¬ 
tance chi-quadrado resulta em uma CA. 

CAlculos bAsicos para uma anAlise de correspondence A analise de corres¬ 
pondence nao e muito mais complexa de interpretar do que uma PCA ou analise 
fatorial, mas requer mais manipulates de matrizes. 


1. Comece com uma tabela de linhas x colunas (como uma tabela de contin¬ 
gencia ou uma matriz de locais [linhas] x especies [colunas]) com m linhas 
e n colunas, e para a qual m> n. Esta frequentemente e uma restri<;ao nos 
programas de CA. Note que se m < nna matriz de dados originais, sua trans- 
posi^ao atendera a condi^ao de que m > n, e a interpreta^ao dos resultados 
sera identica. 

2. Crie uma matriz Q cujos elementos q x) sao proporcionais a valores de chi-qua¬ 
drado: 




f \ 

observado - esperado 

V esperado 

^ total geral 
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Os valores esperados sao calculados como descrevemos no Capitulo 11 para 
testes de independence de chi-quadrado (Equa^ao 11.4). 

3. Aplique uma decomposi^ao de valor singular a Q: Q = UWV T , onde U e uma 
matriz m x n, V e uma matriz nxn, U e V sao matrizes ortonormais, e W e 
uma matriz diagonal (ver Apendice para detalhes). 

4. Observe que o produto Q T Q = VW T WV T . 

5. A nova matriz diagonal W’W, escrita como A, tern elementos A, ; que sao au- 
tovalores de Q T Q. A matriz V tern colunas que sao autovetores nos quais os 
elementos sao as cargas das colunas da matriz de dados originais. A matriz U 
tern colunas que sao autovetores em que os elementos sao as cargas das linhas 
da matriz de dados originais. 

6. Use as matrizes U e V para plotar separadamente as localiza<;6es das linhas 
e das colunas no espa^o de ordena<;ao. As localiza0es tambem podem ser 
plotadas juntas em um bi-plot de ordena^ao, de modo que voce possa ver as 
relates entre, digamos, os locais e as especies. Entretanto, a analise de redun¬ 
dance (RDA; ver abaixo) e um metodo mais direto para verificar as relates 
conjuntas entre dados de locais (ambiental) e de especies (compos^ao). 

Como a PCA e a analise fatorial, a CA resulta em eixos principais e escores, 
embora, neste caso, tenhamos escores tanto para as linhas (p. ex., locais) quan¬ 
to para as colunas (p. ex., especies). Assim como na PCA e na analise fatorial, 
o primeiro eixo de uma CA tern o maior autovalor (explica a maior parte da 
variancia nos dados), bem como maximiza a associa<;ao entre linhas e colunas. 
Os eixos subsequentes explicam a varia^ao residual e tern autovalores sucessi- 
vamente menores. Raras vezes usamos mais de dois ou tres eixos de uma CA, 
porque imagina-se que cada eixo representa um gradiente ambiental particular, 
e porque um sistema com mais de tres gradientes nao relacionados e de dificil 
interpreta^ao. 

Um breve exemplo Usamos a CA para examinar a rela^ao conjunta da composi- 
<;ao de generos de formiga em quatro locais: Connecticut, Massachusetts no con- 
tinente e em ilhas distantes de sua costa e em Vermont (Tabela 12.9). Esses locais 
diferem ligeiramente na latitude (~ 3°) e se estao no continente ou em ilhas. 

Os primeiros dois eixos da CA explicam 58% e 28% (total = 86%) da va¬ 
riancia dos dados, respectivamente. O grafico da ordena^ao dos locais (Figura 
12.10A) mostra uma discrimina^ao entre os locais similar aquela observada com 
a PCoA: CT e VT se agrupam unidos, e sao separados de MA ao longo do primei¬ 
ro eixo. O segundo eixo principal separa os locais de MA no continente dos locais 
nas ilhas de MA. A separa^ao dos generos com relat^ao aos locais tambem e apa- 
rente (Figura 12.10B). Os generos com apenas uma ocorrencia (como Ponera na 
amostra de VT, Brachymyrmex na amostra de MA no continente, e Crematogaster 
e Paratrechina na amostra de ilhas em MA) se separam da mesma forma que os 



442 Nicholas J. Gotelli e Aaron M. Ellison 


(A) 


(B) 


< 

u 

ro 

“O 

PM 

O 


100 -| 
80 - 

60 - 

40 - 

20 - 

0 - 


MA no continente 


CT 


llhas em MA 

• 


VT 


- 1 - 1 -r~ 

0 20 40 60 80 

Eixo 1 da CA 


100 
80 -| 

Amblyopone 
Leptothorax 
50 -I Myrmecina 
Prenolepis 


100 


40 - 

20 - 

0 

0 


• Brachymyrmex 


Dolichoderus 
Lasius • 

Myrmica Aphaenogaster 
Formica • Stenamma Camponotus 


Poneram 


Crematogaster 

Paratrechina 

-1- 

20 


Tapi noma 


40 


~~T" 

60 


~l-1 

80 100 


(C) 



Figura 12.10 Resultados de uma analise de correspondence (CA) da matriz de locais x generos de formiga 
da Tabela 12.9.0 grafico A mostra a ordena^ao dos locais, o grafico B, a ordena^ao dos generos, e o grafico C e 
um bi-plot mostrando a rela^ao entre as duas ordena^oes. Os resultados da ordena^ao dos locais sao similares 
aqueles da analise de coordenadas principais (Figura 12.9), enquanto a ordenagao dos generos separa-os com 
apenas uma ocorrencia, como Ponera, na amostra de VT, Brahymyrmex, na amostra de MA no continente, e 
Crematogaster e Paratrechina, na de ilhas em MA. Os resultados da ordena^ao foram redimensionados de 
forma que as ordenagoes dos locais e das especies possam ser apresentadas no mesmo grafico. Em (C), os locais 
sao indicados por pontos pretos e os generos de formigas por pontos verdes. 


locais. Os generos remanescentes sao arranjados mais para o centra do espa^o de 
ordena^io (Figura 12.10B). A sobreposi^ao das duas ordena^oes captura as rela¬ 
tes desses generos com os locais (compare a matriz de locais x generos na Tabela 
12.9 com a Figura 12.10C). Usando mais informa^oes sobre os locais (Gotelli & 
Ellison, 2002a), podemos tentar inferir informa^oes adicionais sobre as relates 
entre cada genera e as caracteristicas dos locais. 

Entretanto, voce deve ser cauteloso ao fazer tais inferencias. A dificuldade e 
que a analise de correspondence executa uma ordena^ao simultanea das linhas 
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e colunas da matriz de dados, e avalia quao bem as duas ordena^oes estao asso- 
ciadas uma com a outra. Assim, esperamos um grau de sobreposi^ao razoavel en- 
tre os resultados das duas ordena^oes (como na Figura 12.IOC). Como os dados 
empregados na CA sao essencialmente os mesmos daqueles usados na analise de 
tabela de contingencia, o teste de hipotese e a modelagem preditiva sao melhor 
realizados usando os metodos descritos no Capitulo 11. 

O efeito do arco e o destendenciamento A analise de correspondencia tern 
sido muito usada para explorar as relaqoes entre as especies ao longo de gra- 
dientes ambientais. Entretanto, como outros metodos de ordenaqao, ela tern 
a propriedade matematica lamentavel de comprimir as extremidades de um 
gradiente ambiental e acentuar o centro. Isso pode resultar em graficos de orde- 
na^ao que sao encurvados, como um arco ou em forma de ferradura (Legendre 
8c Legendre, 1998; Podani 8c Miklos, 2002), mesmo quando as amostras sao 
uniformemente espaqadas ao longo do gradiente ambiental. Um exemplo disso 
e visto na Figura 12.10A. O primeiro eixo dispoe os quatro locais linearmente; 
o segundo eixo puxa o local MA no continente para cima. Esses quatro pontos 
formam um arco relativamente suave. Em muitos casos, o segundo eixo da CA 
pode ser simplesmente uma distorqao quadratica do primeiro eixo (Hill, 1973; 
Gauch, 1982). 

Uma tecnica de ordenaqao confiavel e interpretavel deve preservar as re¬ 
lates de distancia entre os pontos, e seus valores originais e os criados pela 
ordena^ao devem ser igualmente distantes (ate uma extensao possivel, de acor- 
do com o numero de eixos que e selecionado) quando medidos. Para muitas 
medidas de distancia comuns (incluindo a medida chi-quadrado, usada na CA), 
o efeito do arco distorce as relates de distancia entre as novas variaveis cria- 
das pela ordena^ao. A analise de correspondencia destendenciada (Detrended 
Correspondence Analysis - DCA: Gauch, 1982) e usada para remover o efeito do 
arco da analise de correspondencia e presumivelmente ilustrar mais acuracia 
na rela^ao de interesse. Entretanto, Podani 8c Miklos (2002) mostraram que o 
arco e uma consequencia matematica da aplicaqao da maioria das medidas de 
distancia as especies que respondem de forma unimodal aos gradientes ambien¬ 
tais subjacentes. Embora a DCA seja amplamente implementada em programas 
de ordenaqao, ela nao e mais recomendada (Jackson 8c Somers, 1991). O uso de 
medidas de distancia alternativas (Podani 8c Miklos, 2002) e uma soluqao me¬ 
lhor para o problema do arco. 

Escalonamento multidimensional nao metrico 

Os quatro metodos de ordenaqao anteriores sao similares no que diz respeito as 
distancias entre as observances no espaqo multivariado a serem preservadas, na 
medida do possivel, depois dos dados multivariados terem sido reduzidos a um 
numero menor de variaveis compostas. Em contraste, o objetivo no escalona¬ 
mento multidimensional nao metrico ( Non-Metric Multidimensional Scaling 
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- NMDS) e terminar com um grafico no qual objetos diferentes sao posiciona- 
dos distantes no espa^o de ordena^ao, enquanto os similares sao posicionados 
proximos. Apenas a ordem de classifica^ao das distancias ou dissimilaridades 
originais e preservada. 

CAlculos bAsicos do escalonamento multidimensional nAo metrico Fazer um 
escalonamento multidimensional nao metrico requer nove passos, alguns deles 
sao repetidos. 

1. Gere uma matriz de distancia ou dissimilaridade D a partir dos dados. Qual- 
quer medida de distancia ou dissimilaridade pode ser usada (Tabela 12.6). Os 
elementos d,- em D sao distancias ou dissimilaridades entre as observances. 

2. Escolha o numero de dimensCes (eixos) n para ser usado ao fazer a ordena- 
nao. Use dois ou tres eixos, porque a maioria dos graficos e bi (eixos x e y) ou 
tridimensional (eixos x, y e z). 

3. Comece a ordena<pao posicionando as m observances no espa^o n dimen¬ 
sional. As analises subsequentes dependem muito desta inicializanao, pois 
o NMDS encontra sua solu<;ao por minimizanao local (similar a regressao 
nao linear; ver Capitulo 9). Se alguma informa^ao geografica estiver dispo- 
nivel (como latitude e longitude), pode ser usada como ponto de partida. 
Alternativamente, o resultado de outra ordena<;ao (como a PCoA) pode ser 
usado para determinar a posi«;ao inicial das observances em um NMDS. 

4. Calcule novas distancias 8 y entre as observances na configuranao inicial. Nor- 
malmente, distancias euclidianas sao usadas para calcular 8 y . 

5. Fana uma regressao de 8, ( contra d t] . O resultado dessa regressao e um conjun- 
to de valores preditos 8 ( .. Por exemplo, se usarmos uma regressao linear, = 
(3 0 + (3|+ Ejj, entao os valores preditos sao: 

8,y=Po+Mij 

6. Calcule a bondade do ajuste entre 8, ; e 8 ( .. A maioria dos programas de NMDS 
calcula como um estresse: 


m n 

IKVV 2 


Estresse = 


»=i H 



d, 


O estresse e calculado sobre o triangulo inferior da matriz quadrada D. O 
numerador e a soma geral do quadrado da diferenna entre os valores obser- 
vados e esperados, e o denominador e o grande somatorio dos quadrados dos 
valores esperados. Note que o estresse parece muito com uma estatistica de 
teste chi-quadrado (ver Capitulo 11). 
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7. Mude levemente a posi^ao das m observances no espa^o n dimensional para 
reduzir o estresse. 

8. Repita os passos 4 a 7 ate que o estresse nao possa mais ser reduzido. 

9. Plote a posi^ao das m observances no espano n dimensional para que o estres¬ 
se seja minimo. Este grafico ilustra a “relanao” entre as observances. 

Um breve exemplo Usamos NMDS para analisar os dados de formigas na Tabela 
12.8. Adotamos a medida de dissimilaridade de Sorensen como nossa medida de 
distancia. O scree plot dos escores de estresse indica que duas dimensCes sao su- 
ficientes para a analise (Figura 12.11). Como na CA e na PCoA, temos uma boa 
discriminanao entre os locais (Figura 12.12A), e boa separanao entre assembleias 
de generos com apenas uma ocorrencia (Figura 12.12B). Como a escala dos eixos 
no NMDS e arbitraria, nao podemos sobrepor esses dois graficos em um bi-plot 
de ordenanao. 

Vantagens e desvantagens da ordenanao 

Os ecologos e cientistas da area ambiental usam a ordenanao para: reduzir dados 
multivariados complexos para um conjunto de dados menor e mais manejavel, 
para ordenar os locais com base nas variaveis ambientais de assembleias de espe- 
cies e para identificar respostas das especies aos gradientes ou perturbances am¬ 
bientais. Como alguns metodos de ordenanao (como a PCA e a analise fatorial) 
em geral estao disponiveis na maioria dos pacotes estatisticos comerciais, temos 
acesso facil, e frequentemente com menus, a essas ferramentas. Quando usada 



Dimensoes 


Figura 12.11 Scree plot para as dimensoes em uma analise de Escalonamento Multidimen¬ 
sional Nao Metrico (NMDS) dos dados de locais x generos de formiga (Tabela 12.9). Uma matriz 
de distances par-a-par para os quatro locais e calculada a partir desses dados (Tabela 12.10) 
e usada no NMDS. Em um NMDS, o estresse nos dados e uma medida de desvio similar a uma 
estati'stica de bondade do ajuste de chi-quadrado. Esse scree plot ilustra a redunao sucessiva 
no estresse com o aumento de dimensoes no NMDS dos dados de formigas. Nenhuma redunao 
significativa no estresse e obtida com mais de tres dimensoes, explicando a maior parte da bon¬ 
dade do ajuste. 
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Figura 12.12 Grafico das duas primeiras dimensoes da analise de Escalonamento Multidimensional Nao Me- 
trico (NMDS) dos dados de locais x generos de formiga da Tabela 12.9. Uma matriz de distances par-a-par para 
os quatro locais e calculada a partir desses dados (Tabela 12.10) e usada no NMDS. (A) Ordenanao dos locais. (B) 
Ordenanao dos generos. 


com prudencia, a ordenanao pode ser uma ferramenta poderosa na explora^ao de 
dados, para ilustrar padroes e gerar hipoteses que possam ser testadas com amos- 
tragens ou experimentos subsequentes. 

As desvantagens da ordenanao nao sao aparentes, porque essas tecnicas tern 
sido automatizadas em varios programas, os mecanismos sao ocultos e os pres- 
supostos raras vezes sao enunciados. A ordenanao baseia-se em algebra de matri- 
zes, com a qual muitos ecologos e cientistas da area ambiental nao sao familiares. 
Como os eixos principals em geral sao redimensionados antes de plotar os escores 
principals, estes sao interpretaveis apenas em rela«;ao uns aos outros, sendo dificil 
relaciona-los de volta as medidas originais. 

Recomenda(;oes Raras vezes fica evidente qual tecnica de ordenanao voce deve 
escolher no intuito de melhor ordenar as observances, amostras ou populates 
no espa^o multivariado. A simples redunao dos dados e melhor efetuada pela 
analise de componentes principals (PCA) quando distancias euclidianas sao 
apropriadas e nao ha presenna de dados discrepantes ou dados muito assime- 
tricos. A analise de coordenadas principals (PCoA) e apropriada quando outras 
medidas de distancia sao necessarias (a PCA e equivalente a uma PCoA quando 
distancias euclidianas sao empregadas). Recomendamos a PCoA para a maio- 
ria das aplicanoes de ordenanao nas quais o objetivo e preservar as distancias 
multivariadas originais entre as observances no espano reduzido (ordenanao). 
O escalonamento multidimensional nao metrico (NMDS) preserva apenas a or- 
dem de classificanao das distancias, mas pode ser usado com qualquer medida 
de distancia. A analise de correspondence (CA) e um metodo de ordenanao 
razoavel para examinar a distribuinao de especies ao longo de gradientes am- 
bientais, mas a sua prima, a analise de correspondence destendenciada (DCA), 
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nao deve mais ser usada. Da mesma forma, os resultados da analise fatorial sao 
dificeis de interpretar e muito dependentes de metodos de rota^ao subjetivos. 
Em todos os casos, e importante lembrar as questCes ecologicas e ambientais de 
interesse subjacentes. Por exemplo, se a questao original era ver como especies 
ou caracterlsticas sao distribuldas ao longo de um gradiente ambiental, entao 
simplesmente plotar a variavel resposta contra uma medida apropriada do am- 
biente (ou o primeiro ou o segundo eixo principal) pode ser mais informativo 
que qualquer grafico de ordena^ao. 

Independentemente do metodo, a ordena<;ao deve ser usada com cautela para 
o teste de hipCteses, sendo mais util para a exploranao de dados e geraqio de pa- 
drCes. Entretanto, os testes de hipoteses classicos podem ser realizados sobre os 
escores resultantes de qualquer ordena«;ao, desde que os pressupostos dos testes 
sejam atendidos. 

CLASSIFICA^AO 

A classifica^ao e o processo atraves do qual agrupamos os objetos. Enquanto o 
objetivo da ordenanao e separar as observances ou amostras ao longo de gradien- 
tes ambientais ou eixos biologicos, o objetivo da classificanao e agrupar objetos 
similares em classes identificaveis e interpretaveis que podem ser distinguidas das 
classes vizinhas. A taxonomia e uma aplica^ao familiar da classificanao - um taxo- 
nomista come^a com uma cole^ao de especimes e deve decidir como atribui-los 
em especies, generos, familias e grupos taxonomicos superiores. Independente de 
a taxonomia ser fundamentada na morfologia, em sequencias genicas, ou na his- 
toria evolutiva, o objetivo e o mesmo: um sistema de classifica^o inclusiva com 
base em grupos de agrupamentos hierarquicos. 

Os ecologos e cientistas da area ambiental podem desconfiar de classifica- 
^oes porque se assume que as classes representam entidades discretas, enquanto 
estamos mais acostumados a lidar com varia^ao continua na estrutura de co- 
munidades ou na morfologia que esta mapeada em gradientes ambientais con¬ 
tinues. A ordena^ao identifica padroes dentro de gradientes, enquanto a classi- 
fica<;ao identifica pontos finais ou extremos dos gradientes enquanto ignora os 
intermediaries. 

Analise de agrupamentos 

O tipo mais familiar de analise de classifica«;ao e a analise de agrupamentos ( clus¬ 
ter analysis). A analise de agrupamentos pega m observances, das quais cada uma 
esta associada com n variaveis numericas continuas e segrega as observances em 
grupos. A Tabela 12.11 ilustra o tipo de dados usados na analise de agrupamentos. 
Cada uma das nove linhas da tabela representa um pais diferente onde as amos¬ 
tras foram coletadas. Cada uma das tres colunas da tabela representa uma medida 
morfologica obtida de especimes do caramujo marinho Littoraria angulifera. O 
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TABELA 12.11 Medidas de conchas de caramujos usadas na analise de 
agrupamentos 


Pais 

Continente Proporcionalidade 

Circularidade 

Altura 
do espiral 

Angola 

Africa 

1,36 

0,76 

1,69 

Bahamas 

America do N. 

1,51 

0,76 

1,86 

Belize 

America do N. 

1,42 

0,76 

1,85 

Brasil 

America do S. 

1,43 

0,74 

1,71 

Florida 

America do N. 

1,45 

0,74 

1,86 

Haiti 

America do N. 

1,49 

0,76 

1,89 

Liberia 

Africa 

1,36 

0,75 

1,69 

Nicaragua 

America do N. 

1,48 

0,74 

1,69 

Serra Leoa 

Africa 

1,35 

0,73 

1,72 


A forma da concha do caramujo Littoraria angulifera foi medida para amostras de 9 paises. Proporcionali- 
dade da concha = altura/largura da concha, circularidade da concha = largura/altura da abertura e altura do 
espiral = altura da concha/comprimento da abertura. Os valores na tabela sao medias com base em 2 a 100 
amostras por local (dados de Merkt & Ellison, 1998). A analise de agrupamentos reune os diferentes paises 
com base na similaridade na morfologia da concha (ver Figura 12.13). 


objetivo dessa analise e formar agrupamentos de locais com base na similaridade 
da forma da concha. A analise de agrupamentos tambem pode ser usada para 
agrupar locais com base nas abundancias, ou presenna e ausencia de especies, ou 
para agrupar organismos conforme a similaridade de caracteristicas medidas, 
como a morfologia ou as sequencias de DNA. 

Escolhendo um metodo de agrupamento 

Existem varios metodos disponiveis para agrupar dados (Sneath & Sokal, 1973), 
focalizaremos em apenas dois, os quais frequentemente sao usados por ecologos e 
cientistas da area ambiental. 

Agrupamento aglomerativo versus divisivo O agrupamento aglomerativo 
procede tomando varias observances separadas e as reunindo em agrupamentos 
sucessivamente maiores ate que apenas um seja obtido. O agrupamento divisivo, 
por outro lado, procede colocando todas as observances em um grupo e depois 
dividindo sucessivamente, ate que cada observanao esteja em seu proprio agrupa¬ 
mento. Em ambos os metodos, uma decisao deve ser tomada, muitas vezes com 
base em alguma regra estatistica, sobre quantos agrupamentos usar para descrever 
os dados. 

Ilustramos esses dois metodos usando os dados na Tabela 12.11. Os meto¬ 
dos aglomerativos comenam com uma matriz quadrada mxm de distancias, na 
qual os valores sao as distancias morfologicas par-a-par medidas para cada par 
de locais; as distancias euclidianas sao as mais simples de usar (Tabela 12.12), 
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TABELA 12.12 Matriz de distancia euclidiana 
caramujos 

para as medidas 

morfologicas das conchas de 


Angola 

Bahamas 

Belize 

Brasil 

Florida 

Haiti 

Liberia Nicaragua Serra Leoa 

Angola 

0 







Bahamas 

0,23 

0 






Belize 

0,17 

0,09 

0 





Brasil 

0,08 

0,17 

0,14 

0 




Florida 

0,19 

0,06 

0,04 

0,15 

0 



Haiti 

0,24 

0,04 

0,08 

0,19 

0,05 

0 


Liberia 

0,01 

0,23 

0,17 

0,07 

0,19 

0,24 

0 

Nicaragua 

0,12 

0,17 

0,17 

0,05 

0,17 

0,20 

0,12 0 

Serra Leoa 

0,04 

0,21 

0,15 

0,08 

0,17 

0,22 

0,04 0,13 0 


Os dados originais estao detalhados na Tabela 12.11. Como as matrizes de distancia sao simetricas, apenas a metade 
inferior e apresentada. 


mas qualquer medida de distancia (Tabela 12.6) pode ser empregada na analise 
de agrupamentos. Uma analise do tipo aglomerativa come^a com todos os ob- 
jetos - locais, nesta analise - em separado e sucessivamente os agrupa. Vimos, 
na matriz de distancia euclidiana (Tabela 12.12), que o Brasil e mais proximo 
(em unidades de distancia) da Nicaragua, a Angola e mais proxima da Liberia, 
Belize e mais proximo da Florida e as Bahamas sao mais proximas do Haiti. Esses 
agrupamentos formam a linha de baixo do dendrograma (diagrama de arvore) 
mostrado na Figura 12.13. Neste exemplo, Serra Leoa e o local impar (sem par, 
pois o agrupamento aglomerativo trabalha para cima e em pares) e e adicionada 
ao grupo Angola-Liberia para formar um novo agrupamento africano. Os qua- 
tro novos grupos resultantes sao reunidos mais adiante, de tal maneira que os 
agrupamentos sucessivamente maiores contem os menores. Desse modo, o agru¬ 
pamento Bahamas-Haiti e ligado ao grupo Belize-Florida para formar um novo 
agrupamento Caribe-Atlantico Norte; os outros dois grupos formam o Atlantico 
Sul-Africa. 

Uma analise de agrupamentos divisiva come^a com todos os objetos em um 
grupo, e em seguida os divide com base na dissimilaridade. Neste caso, os gru¬ 
pos resultantes sao os mesmos que os produzidos no agrupamento aglomera¬ 
tivo. Mais tipicamente, o agrupamento divisivo resulta em menos grupos, cada 
um com mais objetos, enquanto o aglomerativo resulta em mais grupos, cada 
um com menos objetos. Os algoritmos de agrupamento divisivo tambem podem 
avan<;ar ate um numero pre-determinado de grupos, que e especificado pelo in- 
vestigador antes de realizar a analise. Na atualidade, um metodo raras vezes usado 
de classifica^ao de comunidades, o TWINSPAN (sigla em ingles para “analise de 
especies indicadoras com dois fatores”; ver Gauch, 1982), usa algoritmos de agru¬ 
pamento divisivo. 
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Figura 12.13 Resultados de uma analise de agrupamentos aglomerativos. Os dados originais 
(Merkt & Ellison, 1998) consistem em taxas morfologicas de medidas da concha de caramujos 
(Littoraria angulifera) de varios paises (Tabela 12.11). Um dendrograma (figura ramificada) re- 
une os locais em grupos com base na similaridade na morfologia da concha. 0 eixo-y indica a 
distancia euclidiana na qual os locais (os grupos de m'veis inferiores) sao ligados aos grupos de 
ni'veis superiores. 


Metodos hierArquicos versus nAo hierArquicos Intuitivamente, grupos com 
poucas observances deveriam ser incorporados naqueles de ordem superior, com 
mais observances. Em outras palavras, se as observances a t b estao em um gru- 
po, e as observances c e d estao em outro, um grupo maior, capaz de incluir ate, 
tambem deve adotar btd. Esse arranjo de classificanao deve ser familiar da taxo- 
nomia: se duas especies estao em um genero e duas outras estao em outro genero, 
e os dois generos estao na mesma familia, entao todas as quatro especies tambem 
estao na mesma familia. Aqueles que seguem essa regra sao chamados metodos de 
agrupamento hierarquicos. Tanto os aglomerativos quanto os divisivos podem 
ser hierarquicos. 

Em contraste, os metodos de agrupamento nao hierarquicos reunem as ob¬ 
servances sem depender de um sistema de referenda externamente imposto. A 
ordenanao pode ser considerada analoga ao agrupamento nao hierarquico - os 
resultados de uma ordenanao com frequencia sao independentes de ordenanoes 
do sistema externamente impostas. Por exemplo, duas especies do mesmo genero 
podem terminar em diferentes grupos produzidos pela ordenanao de um conjun- 
to de caracteristicas morfologicas ou do habitat. No passado, os ecologos e cien- 
tistas da area ambiental eram mais propensos a usar metodos nao hierarquicos do 
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que os hierarquicos, visto que o agrupamento era usado para buscar padroes nos 
dados e para gerar hipoteses. Contudo, conforme mais estudos come^aram a in- 
corporar dados filogeneticos (Losos, 1996), os metodos hierarquicos puderam ser 
mais usados, pois as filogenias conhecidas impoem uma estrutura de referenda 
externa ao sistema de estudo. 

O agrupamento por JC-medias ( K-means) e um metodo nao hierarquico que, 
primeiro, requer que voce especifique quantos grupos deseja. O algoritmo cria 
grupos de tal forma que todos os objetos internos estejam mais proximos uns dos 
outros (com base em uma medida de distancia) do que eles estao de objetos den- 
tro de outros grupos. O agrupamento por FC-medias minimiza o somatorio dos 
quadrados das distancias de cada objeto ao centroide do seu grupo. 

Primeiro, aplicamos o agrupamento por iC-medias aos dados de caramujos 
especificando dois grupos. Um, consistindo de amostras da Angola, Brasil, Liberia, 
Nicaragua e Serra Leoa, com conchas relativamente pequenas (centroide: propor- 
cionalidade = 1,39; circularidade = 0,74; altura do espiral = 1,70), o outro (Baha¬ 
mas, Belize, Florida e Haiti) contendo conchas relativamente grandes (centroide 
= 1,47; 0,76; 1,87). O somatorio interno dos quadrados para o primeiro grupo 
(Africa-Atlantico Sul) e igual a 0,14, e, para o segundo grupo (Caribe-Atlantico 
Norte), 0,06. Um agrupamento por JC-medias desses dados especificando tres gru¬ 
pos divide o grupo Africa-Atlantico Sul em dois, um para os locais africanos e 
outro para a Nicaragua e o Brasil. 

Como escolher quantos grupos usar? Nao existe nenhuma regra rigida e rapi- 
da, mas quanto mais grupos se usa menor e o numero de membros em cada um, 
e mais similares os grupos serao uns com os outros. Hartigan (1975) sugere que 
primeiro voce fa^a um agrupamento por IC-medias com k e k + 1 grupos em uma 
amostra de m observances. Se: 


V cc 

Z, (dentro Kgrupos) 
^ ^^(dentro deK+1 grupos) 


>10 


(12.30) 


entao faz sentido adicionar o (k+ l)-esimo grupo. Se a desigualdade na Equa<;ao 
12.30 for inferior a 10, e melhor parar com k grupos. A Equa<;ao 12.30 ira gerar 
um numero grande sempre que a adi<;ao de um grupo aumente substancialmente 
a soma dos quadrados dentro de grupos. No entanto, em estudos de simulanao, 
a Equa^ao 12.30 tende a superestimar o numero real de grupos (Sugar & James, 
2003). Para os dados de caramujos da Tabela 12.11, a Equa^ao 12.30 = 8,1, suge- 
rindo que dois grupos sao melhores que tres. Sugar & James (2003) revisam uma 
ampla gama de metodos para identificar o numero de grupos em um conjunto de 
dados, uma area ativa de pesquisa em analise multivariada. 

Analise discriminante 

A analise discriminante e usada para atribuir amostras a grupos ou classes que 
sao definidas a priori; ela se comporta como uma analise de agrupamentos ao 
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avesso. Retomando o exemplo dos caramujos, podemos usar as localiza^oes geo- 
graficas para definir grupos a priori. As amostras de caramujos vem de tres conti- 
nentes: Africa (Angola, Liberia e Serra Leoa), America do Sul (Brasil), e America 
do Norte (todo o resto). Se nos tivessem passado apenas os dados de forma da 
concha (tres variaveis), poderiamos atribuir as amostras ao continente correto? A 
analise discriminante e usada para gerar combina<;6es lineares de variaveis (como 
na PCA: Equa^ao 12.21) que sao mais tarde usadas para separar o melhor possivel 
dos grupos. Como na MANOVA, a analise discriminante requer que os dados se 
conformem a uma distribu^ao normal multivariada. 

Podemos gerar uma combina<;ao linear das variaveis originais, usando a 
Equa«;ao 12.21: 


Z i~ a i\ Y \ + a i2 Y 2 + 


+ a in Y n 


Se as medias multivariadas Y variam entre os grupos, queremos encontrar 
os coeficientes a da Equa<;ao 12.20 que maximizam as diferen^as entre os grupos. 
Especificamente, os coeficientes a in sao aqueles que maximizam a razao-F em uma 
ANOVA - em outras palavras, queremos que a soma dos quadrados entre grupos 
seja a maior possivel para um dado conjunto de Z- s. 

Mais uma vez, retornamos as nossas matrizes H (entre grupos) e E (dentro de 
grupos, ou erro; ver a discussao anterior, na MANOVA) da soma dos quadrados 
e dos produtos cruzados (SQPC). Os autovalores e autovetores da matriz E^H 
sao entao determinados. Se ordenarmos os autovalores do maior para o menor 
(como na PCA, por exemplo), seus autovetores a, correspondentes sao os coefi¬ 
cientes da Equa^ao 12.21. 

Os resultados desta analise discriminante sao dados na Tabela 12.13. Este pe- 
queno subconjunto de todo o conjunto de dados se desvia da normalidade mul¬ 
tivariada ( E n = 31,32, P - 2 x 10~\ com 6 graus de liberdade), mas o conjunto de 
dados completo (de 1.042 observa 9 oes) passou nesse teste de normalidade multi¬ 
variada (P = 0,13). Embora as medias multivariadas (Tabela 12.13A) nao difiram 
significativamente por continente (lambda de Wilk = 0,108, F = 2,7115, P = 0,09 
com 6 e 8 graus de liberdade), ainda podemos ilustrar a analise discriminante. 12 
Os primeiros dois autovetores (Tabela 12.13B) explicaram 97% da variancia nos 
dados, e foram usados na Equa^ao 12.21 para calcular os escores dos componen- 
tes principais para cada uma das amostras originais. Os escores das nove obser- 
va 9 oes da Tabela 12.11 estao plotados na Figura 12.14, com cores diferentes, cor- 
respondendo a conchas de diferentes continentes. Vemos um agrupamento obvio 
das amostras africanas, e outro agrupamento evidente de amostras da America do 
Norte. Entretanto, uma das amostras da America do Norte esta mais proxima da 
America do Sul. 


"O conjunto de dados completo, analisado por Merkt 8c Ellison (1998), tinha 1.042 amostras de 19 
paises. A analise discriminante foi usada para predizer de qual sistema de correntes oceanicas (cari- 
benha, do Golfo do Mexico, corrente do Golfo, Equatorial Norte ou Sul) uma concha veio. A analise 
discriminante atribuiu com sucesso mais de 89% das amostras ao sistema de correntes correto. 
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TABELA 12.13 Analise discriminante por continente dos dados de morfologia da concha de 
caramujos em 9 locais 

A. Medias das variaveis 


Africa 

America do N. 

America do S. 

Proporcionalidade 

1,357 

1,470 

1,430 

Circularidade 

0,747 

0,752 

0,740 

Altura do espiral 

1,700 

1,830 

1,710 

O primeiro passo e calcular a media variavel para as 

amostras agrupadas por continente. 


B. Autovetores 


a, 

fl 2 


Proporcionalidade 

0,921 

0,382 


Circularidade 

-0,257 

-0,529 


Altura do espiral 

0,585 

-0,620 



A analise discriminante gera combina^oes lineares dessas variaveis (similar a PCA), que maximiza a separa^ao das 
amostras por continente. Os autovetores contem os coeficientes (cargas), que sao usados para criar um escore discri¬ 
minante para cada amostra, apenas os dois primeiros, que explicam 97% da variancia, sao mostrados. 


C. Matriz de classifica^ao 


Predito (Classificado) 


Observado 

Africa 

Africa 

3 

America do N. 

0 

America do S. 

0 

%Corretos 

100 


America do N. 

0 

4 

1 

80 


America do S. 

0 

0 

1 

100 


As amostras sao atribuidas a um dos tres continentes de acordo com seus escores discriminantes. Nessa matriz de 
classifica^ao, todas as amostras, exceto uma, foram corretamente atribuidas ao seu continente original. Esse resultado 
nao e muito surpreendente, porque os mesmos dados foram usados para criar o escore discriminante e para classi- 
ficar as amostras. 


D. Matriz de classifica^ao por Jackknife 


Observado 

Africa 

Africa 

2 

Predito (Classificado) 

America do N. America do S. 

0 1 

%Corretos 

67 


America do N. 

0 

3 

2 

60 


America do S. 

0 

1 

0 

0 


Uma abordagem menos enviesada e usar uma matriz de classifica^ao por jackknife, na qual o escore discriminante e 
criado a partir de m - 1 amostras e depois usado para classificar a amostra excluida. Desta forma, a fun^ao discrimi¬ 
nante e independente da amostra que esta sendo classificada. A classifica^ao por jackknife nao teve uma performance 
tao boa quanto as outras matrizes, com apenas 5 das 9 amostras corretamente classificadas por continente. 


O conjunto de dados completo do qual essas relates foram retiradas e detalhado na Tabela 12.11. A analise discriminan¬ 
te e outras tecnicas multivariadas devem ser fundamentadas em amostras muito maiores que as usadas neste exemplo. 
(Dados de Merkt & Ellison, 1998.) 
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Figura 12.14 Um grafico dos dois primeiros eixos de uma analise discriminante de medidas 
de razoes morfologicas em conchas de caramujos (Littoraria angulifera) de varios pai'ses (Tabela 
12.11). A analise discriminante e usada para avaliar quao bem as conchas dos tres continentes dife- 
rentes podem ser distinguidas. Os escores discriminantes foram calculados usando os autovetores 
da Tabela 12.13 e a Equanao 12.21. 

As classifica^oes preditas baseiam-se na minimiza^ao das distancias (geral- 
mente a de Mahalanobis ou euclidiana; ver Tabela 12.6) entre as observances 
dentro de grupos. A aplicanao desse metodo aos dados resulta em predinCes acu- 
radas para as conchas sul-americanas e africanas, mas apenas 80% (4 de 5) das 
conchas norte-americanas foram corretamente classificadas. A Tabela 12.13C 
resume essas classifica<;6es na forma de matriz de classificanao. As linhas da 
matriz de classificanao quadrada representam os grupos observados e as colu- 
nas, os grupos preditos (classificados). Os valores representam o numero de ob¬ 
servances que foram classificadas em um grupo particular. Se o algoritmo de 
classificanao nao fiver erros, entao todas as observances cairao na diagonal. Os 
valores fora da diagonal representam erros na classificanao em que uma obser¬ 
vanao foi atribuida de forma incorreta. 

Nao deve ser nenhuma surpresa que a classificanao predita em uma analise 
discriminante corresponda aos dados observados, afinal, esses dados foram usa- 
dos para gerar os autovetores, que depois usamos para classificar os dados. Assim, 
esperamos que os resultados sejam enviesados em favor da correta atribuinao das 
nossas observances a grupos dos quais elas vieram. Uma solunao para superar 
esses vieses e a randomizanao por jackknife da matriz de classificanao da Tabela 
12.13C. O jackknife retira uma observanao individual do conjunto de dados, rea- 
nalisa os dados sem aquela observanao, depois usa os resultados para classificar a 
observanao retirada (ver tambem “A Funnao de Influencia” no Capitulo 9, e a Nota 
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de rodape 2, Capitulo 5). A matriz de classifica^ao de jackknife e dada na Tabela 
12.13D. Essa classifica^ao e muito pobre, pois as medias multivariadas para cada 
continente nao foram muito diferentes. Por outro lado, normalmente nao faria- 
mos uma analise discriminante em um conjunto de dados tao pequeno. Outra 
solu^ao, se o conjunto de dados original for grande, seria dividi-lo de maneira 
aleatoria em dois grupos: um para construir a classifica^ao e o outro para testa-la. 
Novos dados tambem podem ser coletados e classificados com a fun<;ao discri¬ 
minante, embora precise haver um jeito de verificar independentemente que a 
atribui<;ao dos grupos esta correta. 

Vantagens e desvantagens da classifica^ao 

As tecnicas de classifica^ao sao relativamente faceis de usar e interpretar, e estao 
amplamente implementadas nos programas de estatistica. Elas nos permitem tan- 
to agrupar amostras, quanto atribui-las a grupos identificados a priori. Os den- 
drogramas e as matrizes de classifica^ao resumem e transmitem claramente os 
resultados da analise de agrupamentos e da discriminante. 

No entanto, tanto a analise de agrupamentos quanto a discriminante de- 
vem ser usadas com cautela. Existem diversas maneiras de fazer uma analise 
de agrupamentos, e os diferentes metodos em geral dao resultados diferentes. 
E mais importante decidir um metodo de antemao em vez de tentar todos os 
diferentes metodos e escolher aquele que parecer o mais agradavel ou que se 
conforme a noi^oes preconcebidas. A analise discriminante e muito mais sim¬ 
ples de fazer, porem ela requer dados extensos e a atribui^ao de grupos a priori. 
As analises de agrupamentos e discriminante sao metodos descritivos e explo- 
ratorios. A estatistica da MANOVA pode ser usada com os resultados de uma 
analise discriminante para testar hipoteses acerca das diferen<;as entre grupos. 
Inversamente, a analise discriminante tambem pode ser usada como um teste 
a posteriori para comparar grupos, uma vez que a hipotese nula em uma MA¬ 
NOVA tenha sido rejeitada. 

De fato, as analises de agrupamentos e discriminante partem do pressuposto 
da existencia de grupos ou agrupamentos distintos, enquanto uma hipotese nula 
adequada seria de que as amostras foram obtidas de um unico grupo e que exi- 
bem apenas diferen^as aleatorias entre elas. Strauss (1982) descreve metodos de 
Morte Carlo para testar a significancia estatistica de agrupamentos. O bootstrap e 
outros metodos computacionalmente intensivos para testar a significancia estatis¬ 
tica de grupos tambem sao muito utilizados em analises filogeneticas (Felsenstein, 
1985; Emerson et al., 2001; Huelsenbeck et al., 2002; Sanderson & Shaffer, 2002; 
Miller, 2003; Sanderson & Driskell, 2003). 

REGRESSAO MULTIPLA MULTIVARI ADA 

Os metodos para analise multivariada descritos ate agora foram primariamente 
descritivos (ordenaqao, classifica^ao), ou limitados a variaveis preditoras cate- 
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goricas (teste T de Hotelling e MANOVA). O topico final deste capitulo e uma 
extensao da regressao (uma variavel resposta continua e uma ou mais varia- 
veis preditoras continuas) para dados de resposta multivariados. Dois metodos 
sao comumente usados por ecologos: a analise de redundancia (Redundancy 
Analysis - RDA) e a analise de correspondence canonica (Canonical Corres¬ 
pondence Analysis - CCA). Descrevemos apenas os mecanismos da RDA, que 
e uma extensao direta da regressao multipla para o caso multivariado. A RDA 
assume uma rela^ao causal entre as variaveis dependentes e independentes, en- 
quanto a CCA tern como foco a gera^ao de um eixo unimodal em rela^ao as 
variaveis respostas (p. ex., ocorrencias ou abundancias de especies) e um eixo 
linear em rela^ao as variaveis preditoras (p. ex., caracteristicas do habitat ou do 
ambiente). Uma terceira tecnica, a analise de correla^ao canonica (Hotelling, 
1936; Manly, 1991) baseia-se nas relates simetricas entre as duas variaveis. 
Em outras palavras, a analise de correla^ao canonica assume erro tanto nos 
preditores quanto nas respostas (ver discussao dos pressupostos da regressao 
no Capitulo 9). 

Analise de redundancia 

Um dos usos mais comuns da RDA e para examinar as relates entre composi- 
910 de especies, medida como as abundancias de cada uma de n especies, e ca¬ 
racteristicas ambientais, medida como um conjunto de m variaveis ambientais 
(Legendre & Legendre, 1998). Os dados de composi^ao de especies representam 
a variavel resposta multivariada, e as variaveis ambientais representam a varia¬ 
vel preditora multivariada. Todavia, a RDA nao e restrita a este tipo de analise 
- ela pode ser usada para qualquer regressao multipla envolvendo multiplas 
variaveis respostas e multiplas variaveis preditoras, como demonstraremos em 
nosso exemplo. 

O bAsico em uma anAlise de redundancia Como desenvolvido no Capitulo 9, a 
regressao multipla linear padrao e: 

^=Po+PA+M2+-+P»X„+e,. (12.31) 

Os valores de P ; sao os parametros a serem estimados, e £• representa o erro 
aleatorio. Os metodos padrao de minimos quadrados sao usados para ajustar 
o modelo e obter estimativas nao enviesadas de |3 e £ dos P ( e dos 8 , No caso 
multivariado, a unica variavel resposta Y e substituida por uma matriz Y com 
n variaveis. A analise de redundancia faz a regressao de Y contra uma matriz de 
variaveis independentes X, todas medidas para cada observa<;ao. Os passos de 
uma RDA sao: 

1. Fa<;a uma regressao de cada uma das variaveis respostas individuals Y j de Y 

contra todas as variaveis de X (usando a Equa^ao 12.31). Isso resulta em uma 
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matriz de valores ajustados Y = 
onde B e a matriz de coeficientes 


Essa matriz e calculada como Y = XB, 


Ha regressao: 
B = (X t X) _ 1 X t Y 


A 

2. Use a matriz Y em uma analise de componentes principals de sua matriz de 
variancia e covariancia amostral padronizada, produzindo uma matriz A de 
autovetores. Os autovetores tern a mesma interpreta^ao da PCA. Se voce esta 
fazendo uma RDA de uma matriz de caracteristicas ambientais x especies, os 
elementos de A sao chamados de escores das especies. 

3. Gere dois conjuntos de escores a partir desta PCA. 

a. O primeiro conjunto de escores, F, e calculado multiplicando-se a matriz 
de autovetores A pela de variaveis respostas Y. O resultado, F = YA, e uma 
matriz em que as colunas sao chamadas de escores dos locais. Os escores 
dos locais F sao uma ordena^ao relativa a Y. Se voce esta usando uma 
matriz de caracteristicas ambientais x especies, os escores dos locais sao 
fundamentados nas distributes originais observadas das especies. 

b. O segundo conjunto de escores, Z, e calculado multiplicand© a matriz 
de autovetores A pela de valores ajustados Y. O resultado, Z = YA, e 
uma matriz na qual as colunas sao chamadas escores ajustados dos 
locais. Como Y tambem e igual a matriz XB, a matriz dos escores ajus¬ 
tados locais tambem pode ser escrita como Z = XBA. Os escores ajus¬ 
tados dos locais Z sao uma ordena^ao relativa a X. Se voce esta usando 
uma matriz de caracteristicas ambientais x especies, os escores ajusta¬ 
dos dos locais baseiam-se na distribui^ao das especies que sao preditas 
pelo ambiente. 

4. Em seguida, queremos saber como as variaveis preditoras em X contribuem 
para cada um dos eixos de ordena^ao. A maneira mais simples de medir a 
contribui<;ao das variaveis preditoras e observar que a matriz Z e composta 
de duas partes: X, os valores preditos, e BA, a matriz produto dos coeficientes 
de regressao e dos autovetores da matriz Y. A matriz C = BA nos diz a contri- 
bui<;ao das variaveis X para a de escores ajustados dos locais Z. Essa decom- 
posi<;ao equivale a dizer que os valores em cada uma das colunas de C sao 
iguais aos coeficientes de regressao padronizados da matriz X. Um metodo 
alternativo e determinar a correla^ao entre as variaveis ambientais X (predi¬ 
toras) e os escores dos locais F, que e o produto das variaveis respostas e seus 
autovetores. 

5. Por fim, construimos um bi-plot , como fizemos na analise de correspon¬ 
dence, no qual plotamos os eixos principals dos escores ou de F (os obser- 
vados) ou de Z (os ajustados) para as variaveis preditoras. Neste grafico, 
podemos posicionar a localiza^ao das variaveis respostas. Desta forma, 
podemos visualizar a rela^ao multivariada das variaveis respostas com as 
preditoras. 
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Um breve exemplo Para ilustrar a RDA, retornamos aos dados de caramujos 
(Tabela 12.11). Para cada um dos locais tambem temos medidas de quatro va¬ 
riaveis ambientais: precipita^ao anual (mm), numero de meses secos por ano, 
temperatura mensal media, e altura media do dossel do mangue no qual os ca¬ 
ramujos forrageavam (Tabela 12.14). Os resultados dos quatro passos da RDA 
estao apresentados na Tabela 12.15. Como as variaveis respostas sao medidas 
da forma da concha, a matriz A e composta de escores da forma da concha. As 
matrizes F e Z sao escores dos locais e escores ajustados dos locais, respectiva- 
mente. 

A Figura 12.15 ilustra como os locais covariam com as variaveis ambientais 
(simbolos verdes e setas direcionais) e como as formas das conchas covariam com 
os locais e suas variaveis ambientais (simbolos pretos e setas direcionais). Por 
exemplo, alguns locais no Brasil, na Nicaragua e na Africa sao caracterizados por 
maior altura do dossel e maior precipita^ao, enquanto na Florida e Caribe sao 
caracterizados por maior temperatura e meses secos mais longos. As conchas do 
Caribe e da Florida tern maior proporcionalidade e maior altura do espiral, en¬ 
quanto as da Africa, do Brasil e da Nicaragua sao mais circulares. 

Teste da significAncia dos resultados Os resultados da RDA (e da CCA) 
podem ser testados em termos de significancia estatistica usando metodos de 
simula<;ao de Monte Carlo (ver Capitulo 5). A hipotese nula e que nao ha ne- 
nhuma rela^ao entre as variaveis preditoras e respostas. As randomiza^oes dos 


TABELA 12.14 Variaveis ambientais usadas na analise de redundancia (RDA) 


Pais 

Precipita^ao 
anual (mm) 

N° de meses secos 

Temp, media 
mensal (°C) 

Altura media do 
dossel da floresta (m) 

Angola 

363 

9 

26,4 

30 

Bahamas 

1.181 

2 

25,1 

3 

Belize 

1.500 

2 

29,5 

8 

Brasil 

2.150 

4 

26,4 

30 

Florida 

1.004 

1 

25,3 

10 

Haiti 

1.242 

6 

27,5 

10 

Liberia 

3.874 

3 

27,0 

30 

Nicaragua 

3.293 

0 

26,0 

15 

Serra Leoa 

4.349 

4 

26,6 

35 


Dados de Merkt 8c Ellison (1998). 
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TABELA 12.15 Analise de redundancia da morfologia de pequenas conchas e dados 
ambientais 

A. Calcule a matriz de valores ajustados Y = X(X 1 X) -1 X 1 Y. 


-0,05 

0,01 

-0,04 

0,09 

0,00 

0,09 

0,00 

0,01 

0,08 

-0,05 

-0,01 

-0,08 

0,05 

0,00 

0,03 

0,04 

0,02 

0,09 

-0,05 

-0,01 

-0,07 

0,03 

-0,01 

0,00 

-0,06 

-0,01 

-0,10 


Essa matriz e oresultado da regressao de cada uma das tres variaveis de forma contra as quatro variaveis ambientais. 
Cada linha de Y e uma observa<^ao (de um local; ver Tabela 12.11), e cada coluna e uma das variaveis (proporcionali- 
dade, circularidade e altura do espiral, respectivamente). 


B. Use Y em uma PCA para calcular os autovetores A. 


0,55 

-0,81 

-0,19 

A= 

0,08 

0,27 

-0,96 


0,83 

0,52 

0,21 


Esses sao os escores da forma da concha, e poderiam ser usados para calcular os valores dos componentes principals 
(Zj) para a forma da concha. As colunas representam os tres primeiros autovetores, as linhas representam as tres 
variaveis morfologicas. O componente 1 explica 94% da variancia na forma da concha. A circularidade da concha, 
que e grosseiramente constante entre os locais (ver Tabela 12.11), tern pouco peso ( a 21 = 0,08) no Componente 
Principal 1. 

C. Calcule a matriz dos escores dos locais F = YA e a matriz dos escores ajustados dos locais Z =YA. 


'2,21 

-0,03 

-0,63" 


—0,06 

0,02 

-0,01~ 

2,44 

-0,06 

-0,62 


0,13 

-0,03 

0,00 

2,38 

0,00 

-0,61 


0,07 

0,04 

0,01 

2,26 

-0,08 

-0,62 


-0,09 

0,00 

0,00 

2,40 

-0,02 

-0,59 

Z = 

0,05 

-0,02 

0,00 

2,45 

-0,03 

-0,61 


0,10 

0,02 

0,00 

2,21 

-0,03 

-0,62 


-0,09 

0,00 

0,00 

2,28 

-0,13 

-0,63 


0,01 

-0,03 

0,00 

2,23 

-0,01 

-0,59 


-0,12 

0,00 

0,00 


A matriz F contem os escores dos componentes principals para os valores de forma da concha obtidos multiplicando 
os valores originais (Y) pelos autovetores da matriz A. A matriz Z contem os escores dos componentes principais 
para os valores de forma da concha obtidos multiplicando os valores ajustados (Y), que sao derivados da matriz de 
habitat X (Tabela 12.14), pelos autovetores em A. 


( Continua ) 
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TABELA 12.15 Analise de redundancia da m 
ambientais ( Continua$ao ) 

orfologia de pequenas conchas e dados 

D. Calcule a matriz C = 

BA para obter os coeficientes da regressao contra X. 




’ 0,01 

0,00 

o,oo" 




c = 

0,03 

0,00 

0,01 

0,02 

0,00 

0,00 





-0,11 

0,00 

0,00 



As linhas sao as quatro variaveis ambientais e as colunas, os tres primeiros componentes principais. Os coeficientes 
0,00 sao valores arredondados de numeros menores. Alternativamente, podemos calcular as correlates das variaveis 
ambientais X com os escores dos locais F. As entradas das celulas sao os coeficientes de correla^ao entre X e as colunas 
de F: 


Componente 1 

Componente 2 

Componente 3 

Precipita^ao 

-0,55 



-0,19 

0,11 

Meses secos 

-0,28 



0,34 

-0,18 

Temperatura media 

0,02 



0,49 

0,11 

Altura do dossel 

-0,91 



0,04 

-0,04 


Neste exemplo, regredimos as caracteristicas da forma da concha de caramujos (Tabela 12.11) contra dados ambientais 
(Tabela 12.13). Antes da analise, os dados ambientais foram padronizados usando a Equa^ao 12.17. (Dados de Merkt & 
Ellison, 1998.) 


dados brutos - intercambiando as linhas da matriz Y - sao seguidas de repeti- 
<;ao da RDA. Entao, comparamos a estatlstica-F calculada dos dados originais 
com a distribui^ao das estatlsticas-F dos dados randomizados. A estatistica F 
para esse teste e: 

/ \ 
n 

H 

m 

F ^ (12.32) 

r SQR 

Nesta equa<;ao, ^^ea soma dos autovalores, SQR e a soma dos quadrados 
dos residuos (calculada como a soma dos autovalores da PCA usando (Y - Y) no 
lugar de Y (Tabela 12.15B), me o numero de variaveis preditoras e p e o numero 
de observa^oes. Embora o tamanho da amostra seja muito pequeno para uma 
analise significativa, ainda podemos usar a Equa^ao 12.32 para ver se nossos re- 
sultados sao estatisticamente significativos. O valor de F para nossos dados origi¬ 
nais = 3,27. Um histograma dos valores de F de 1.000 randomiza<;6es dos nossos 
dados e mostrado na Figura 12.16. A compara<;ao do valor de F observado com as 
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Figura 12.15 Bi-plot dos dois primeiros eixos de uma Analise de Redundance (RDA) da re- 
gressao dos dados de conchas de caramujos (Tabela 12.11) contra os dados ambientais (Tabela 
12.14), sendo que todos eles foram medidos em 9 pafses (Merkt & Ellison, 1998). Os nomes dos 
pai'ses indicam a localiza^ao de cada local no espa^o de ordena^ao (a matriz F da Tabela 12.15). 
Os smnbolos pretos indicam a localiza^ao das variaveis morfologicas no espa^o dos locals. Entao, 
as conchas de Belize, Florida, Haiti e Bahamas tern maior proporcionalidade e maior altura do 
espiral que as dos outros locais, enquanto as conchas da Africa, do Brasil e da Nicaragua sao mais 
circulares. As setas pretas indicam a dire^ao do aumento da variavel morfologica. Similarmente, 
os simbolos e setas verdes indicam como os locais foram ordenados. Todos os valores foram pa- 
dronizados para permitir a plotagem de todas as matrizes em escalas similares. Entao, os compri- 
mentos das setas nao indicam a magnitude dos efeitos. Entretanto, indicam sua direnao ou seu 
peso sobre os dois eixos. 


randomiza<;6es da um valor de P exato de 0,095, que e marginalmente maior do 
que o tradicional ponto de corte de P = 0,05. A conclusao limitada (com base em 
um tamanho amostral limitado) e que nao existe rela^ao significativa entre mor- 
fologia do caramujo e varia^ao ambiental entre esses nove locais. 13 Ver Legendre 
& Legendre (1998) para detalhes adicionais e exemplos de testes de hipoteses na 
RDA e na CCA. 

Uma extensao da RDA, aquela com base em distancias (ou db-RDA) e um 
metodo alternative para testar modelos multivariados complexos (Legendre & 
Anderson, 1999; McArdle & Anderson, 2001). Ao contrario da MANOVA clas- 
sica, a db-RDA nao requer que os dados tenham uma distribui^ao normal mul- 
tivariada, que as medidas de distancia entre observances sejam euclidianas, ou 
que existam mais observances do que variaveis respostas medidas. A RDA com 
base em distancias pode ser usada com qualquer medida de distancia, metrica 
ou semimetrica, e permite a partinao dos componentes de varianao em modelos 


'"Em contraste, a analise do conjunto de dados completo com 1.042 observances de 19 paises deu 
uma associa^ao significativa entre a forma da concha do caramujo e as conduces ambientais (Merkt 
8c Ellison, 1998). 
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Estatisticas F simuladas 

Figura 12.16 Distribui^ao de frequencia das estatisticas F resultantes de 1.000 randomizagoes 
e analise de redundancia (RDA) dos dados de caramujos (Tabela 12.11), em que os rotulos dos 
paises foram embaralhados de maneira aleatoria entre as amostras. A estatistica F para os dados 
observados = 3,27. Noventa e cinco randomiza^oes tiveram uma estatistica F maior, de forma que 
o valor de P para a RDA na Figura 12.15 = 0,095. Esse resultado e marginalmente nao significativo 
usando um rn'vel de a igual a 0,05, refletindo a limita^ao de usar a RDA em um conjunto de dados 
tao pequeno. 


de MANOVA complexos. Como a RDA, ela usa testes de randomiza^o para 
determinar a significance dos resultados. A RDA com base em distances tern 
sido implementada nas novas versoes de programas para analise multivariada 
(ver Rejmanek & Klinger, 2003, para uma revisao recente desses programas). 


RESUM0 


Os dados multivariados contem multiplas variaveis respostas nao independentes 
medidas para cada replica. A analise de variance multivariada (MANOVA) e a 
de redundancia (RDA) sao as analogas multivariadas dos metodos de ANOVA e 
regressao usados em analises univariadas. Os testes estatisticos com base na MA¬ 
NOVA e na RDA assumem amostragem aleatoria e independente, assim como 
na analise univariada, mas apenas a MANOVA requer que os dados estejam de 
acordo com uma distribui<;ao normal multivariada. 

A “ordena^ao” e um conjunto de metodos multivariados designados para 
ordenar as amostras ou observances de dados multivariados, e para reduzir da¬ 
dos multivariados para um numero menor de variaveis para analises adicionais. 
A distancia euclidiana e a medida de distancia mais natural entre amostras no 
espa<;o multivariado, mas essa medida pode dar resultados contraintuitivos em 
conjuntos de dados com muitos zeros, como os de abundance ou de presen^a 
e ausencia de especies. Outras medidas de distancia, incluindo as de Manhattan 
e de Jaccard, tern propriedades algebricas melhores, embora indices de similari- 
dade biogeografica com base nessas medidas sejam muito sensiveis a efeitos do 
tamanho amostral. 
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A analise de componentes principals (PCA) e um dos metodos mais simples 
para ordena«;ao de dados multivariados, mas nao e util, a menos que existam cor¬ 
relates subjacentes nos dados originais. A PCA extrai novas variaveis ortogonais 
que capturam a varia^ao importante dos dados e preserva as distancias das amos- 
tras originais no espa^o multivariado. A PCA e um caso especial de analise de 
coordenadas principals (PCoA). Enquanto a PCA e fundamentada em distancias 
euclidianas, a PCoA pode ser usada com qualquer medida de distancia. A analise 
fatorial e um tipo de PCA inversa, na qual as variaveis medidas sao decompos- 
tas em combina^oes lineares de fatores subjacentes. Como os resultados de uma 
analise fatorial sao sensiveis aos metodos de rota^ao e como o mesmo conjunto 
de dados pode gerar mais de um conjunto de fatores, a analise fatorial apresenta 
menor utilidade que a PCA. 

A analise de correspondence (CA) e uma ferramenta de ordena^ao que revela 
as associates entre as assembleias de especies e as caracteristicas dos locais. Ela 
ordena simultaneamente as especies e os locais, e pode revelar agrupamentos ao 
longo de ambos os eixos. Entretanto, muitos problemas tern sido identificados na 
correlata analise de correspondence destendenciada (DCA), que foi desenvolvida 
para lidar com o efeito do arco comum na CA (e outras tecnicas de ordena^ao). 
Uma alternativa a DCA e fazer uma CA usando outras medidas de distancia. O es- 
calonamento multidimensional nao metrico (NMDS) preserva a ordem de ranque 
das distancias, mas nao as proprias, entre as variaveis no espa<;o multivariado. Os 
metodos de ordenaqao sao uteis para redu^ao de dados e para revelar padroes nos 
dados. Os escores da ordena^ao podem ser usados em metodos padrao para testes 
de hipoteses, desde que os seus pressupostos sejam atendidos. 

Os metodos de classifica^ao sao usados para agrupar objetos em classes que 
possam ser identificadas e interpretadas. A analise de agrupamentos usa dados 
multivariados para gerar grupos de amostras. Os algoritmos de agrupamento hie- 
rarquico ou sao aglomerativos (observates separadas sao sequencialmente agru- 
padas em grupos) ou sao divisivos (todo o conjunto de dados e sequencialmente 
dividido em grupos). Os metodos nao hierarquicos, como o agrupamento por 
iOmedias, requerem que o usuario especifique o numero de grupos que serao 
criados, embora regras estatisticas de parada possam ser usadas para decidir o 
numero correto de grupos. A analise discriminante e um tipo de analise de agru¬ 
pamento ao contrario: os grupos sao defmidos a priori, e a analise produz esco¬ 
res das amostras que dao a melhor classifica<;ao. A randomiza^ao por jackknife 
e o teste de conjuntos de dados independentes podem ser usados para avaliar a 
confiabilidade da fun^ao discriminante. Os metodos de classifica^ao assumem, a 
priori, que os grupos ou agrupamentos sao relevantes biologicamente, enquanto o 
teste de hipoteses classico come^aria com uma hipotese nula de varia<;ao aleatoria 
e nenhum grupo ou agrupamento subjacente. 




Apendice 

Algebra de Matrizes 
para Ecologos 


M uitas tecnicas estatisticas podem ser melhor ilustradas usando algebra 
de matrizes. Em particular, as tecnicas multivariadas descritas no Capi- 
tulo 12 recaem sobre algebra de matrizes, e os metodos de regressao (Capitulo 
9) e ANOVA (Capitulo 10) frequentemente sao apresentados em nota^ao de ma¬ 
trizes. Se voce entender o basico da algebra de matrizes, podera fazer programas 
simples para implementar novos metodos estatisticos que sao apresentados em 
artigos cientificos. Neste apendice, explicamos, com brevidade, os fundamentos 
da algebra de matrizes. Se voce deseja aprender mais sobre algebra de matrizes 
em estatistica, Harville (1997) e uma referenda excelente e facil de ler. 

0QUEEUMA MATRIZ? 

A defmi^ao basica de matriz e uma tabela de numeros em que as linhas sao as 
replicas e as colunas sao as variaveis medidas. Mais formalmente, uma matriz e 
um arranjo de regular de numeros que possui m linhas e n colunas. As matrizes 
sao escritas de forma expandida com coeficientes para cada registro. Na forma 
compacta, uma matriz e simbolizada por uma letra maiuscula em negrito: 


a n 

a 12 

.. a ln 

a 2l 

a 22 

.. a 2n 

a m\ 

a m2 ■ 

a mn 


Cada elemento da matriz e indexado com dois subscritos: o primeiro indica 
a linha e o segundo, a coluna. Dessa forma, a 34 e o elemento da matriz A que esta 
na terceira linha e quarta coluna. 

A dimensao de uma matriz e um par de numeros que especifica o numero de 
linhas e de colunas de uma matriz: 

Dim(A) - ( m , n ) 

As matrizes podem ter qualquer numero de linhas ou colunas, mas tres ta- 
manhos sao importantes particularmente. A matriz quadrada e aquela na qual o 
numero de linhas e igual ao de colunas (m = n ): 
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fl,l 

a n ■ 

.. a ht 

a 21 

a 22 ■ 

.. a 2 „ 

_ a nl 

a n2 • 

• • ^nn 


A soma dos elementos de uma matriz quadrada que estao na diagonal princi¬ 
pal, a n + a 22 + ... + a nn , e chamada de tra^o da matriz. 

Um vetor coluna e uma matriz com m linhas e uma coluna: 



^ml 


Um vetor linha e uma matriz com uma linha e n colunas: 

A = [an a 12 ... fl ln ] 

Na algebra de matrizes, um unico numero k e chamado de escalar, para dis- 
tingui-lo de uma matriz com uma linha e uma coluna: 

A — 

OPERATES MATEMAUCAS BASICAS COM MATRIZES 
Adi$ao e subtract) 

A soma e a subtra<;ao de matrizes sao feitas elemento por elemento. Para duas 
matrizes A e B com elementos { a-} e {b^}, respectivamente, sua soma A + B e uma 
nova matriz C em que o elemento ij e igual a a- + h () : 


3 

4 


’ 4 

8~ 


’ 3 + 4 

4 + 8 


7 

12’ 


■1 

5 


1 

-3 

= 

-1 + 1 

5 +(-3) 

= 

0 

2 

(A.1) 

0 

2 


-2 

6 


_ 0 + (—2) 

2 + 6 


-2 

8 



De forma similar, a diferen<;a entre duas matrizes A - B e uma nova matriz C 
em que o elemento i j e igual a a-- b■■. Como a adi^ao e a subtra^ao de matrizes 
sao feitas elemento por elemento, apenas matrizes com a mesma dimensao (i. e., 
matrizes com o mesmo numero de linhas e de colunas) podem ser somadas ou 
subtraidas uma da outra. 

A adi^ao de matrizes e comutativa, o que significa que, para duas matrizes A 
e B de mesma dimensoes, A + B = B + A.A adi^ao de matrizes tambem e associa- 
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tiva: para tres matrizes A, B e C com dimensoes iguais, A + (B + C) = (A + B) + C. 
Voce ja deve ter visto essas propriedades comutativas e associativas antes, pois elas 
tambem se aplicam a aritmetica simples. 

Multiplicand 

Dois tipos de calculo sao possiveis com matrizes. Quando multiplicamos uma 
matriz A de qualquer dimensao por um unico numero, ou escalar k, o produto 
kA e uma nova matriz com a mesma dimensao de A em que os elementos i j sao 
iguais a ka n : 


"l 3 

2 

-5’ 


3x1 

3x3 

3x2 

3x(—5)~ 


"3 

9 

6 

-15’ 

_2 0 

0 

3 


3x2 

3x0 

3x0 

3x3 


6 

0 

0 

9 


(A.2) 


Como na adi<;ao e subtra^ao de matrizes, a multiplica<;ao por uma escalar e 
comutativa (kA = A k) e associativa ( c(kA ) = (ck) A). A multiplica<;ao escalar tam¬ 
bem e distributiva em respeito a adi<;ao: k(A + B) = AA + kB. Como na aritmetica 
simples, 1 x A = A. 

Tambem e possivel multiplicar duas matrizes A e B, com dimensoes (m, n) e 
(p, q), respectivamente, mas apenas se os numeros de colunas da primeira matriz, 
A, for igual ao numero de linhas da segunda matriz, B (i. e., se n = p). O produto 
AB de duas matrizes e uma nova matriz, cujo elemento ij e igual a 

n 

X a ikhj = a n b lj + a ,2 b 2] + ■ ■■ + “inhj 
k=l 


Por exemplo: 



1 

-2 

2" 

1 3 3" 

3 

2 

2 

_2 0 —2_ 





-1 

3 

3 


l(l) + 3(3) + 3(—1) 
2(1)+ 0(3) +(-2) (—1) 


l(-2) + 3(2) + 3(3) 
—2)+ 0(2) +(—2) (3) 


1(2)+ 3(2)+ 3(3) 
2(2)+ 0(2) +(—2) (3) 


7 13 17 

4 -10 -2 


(A.3) 


A dimensao de AB = (m, q ), onde me o numero de linhas da matriz Aeqeo 
de colunas da matriz B. 

Para tres matrizes A, B e C, a multiplica^ao de matrizes e associativa 
[A(BC) = (AB)C], e e distributiva em rela^ao a adi^ao [A(B + C) = AB + AC e 
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(A + B)C = AC + BC]. A multiplicand de matrizes em geral nao e comutativa, 
contudo: AB muitas vezes nao e igual a BA. De fato, voce nem sempre pode 
multiplicar um par de matrizes em ambas dire<;oes, a menos que n = p e m = 
q. Se ambas, A e B, sao matrizes quadradas com dimensoes iguais (m = n = p 
= q), AB e BA sao definidas com (Dim(AB) = (n,n)), mas nem sempre e o caso 
em que AB = BA. Por exemplo: 


1 0 

0 

2 

= 

0 

2 

* 

0 

8 

= 

0 

2 

1 

o’ 

0 4 

2 

1 


8 

4 


2 

4 


2 

1 

0 

4 


Chamamos AB de pre-produto ou a pre-multiplica^ao de B por A. De forma 
equivalente, dizemos que AB e o pos-produto ou pos-multiplicaqio de A por B. 

Note que ha uma diferen^a entre multiplicar uma matriz por uma escalar 
kA e uma matriz por uma matriz com uma linha e uma coluna [k] A. A primeira 
opera^ao e possivel para uma matriz com qualquer numero de linhas e colunas 
(Equa^ao A.2), mas a segunda e possivel apenas para uma matriz com uma linha. 

Se multiplicarmos um vetor linha [dimensoes = (l,n)] por um vetor coluna 
[dimensoes = (p, 1)] o resultado sera uma matriz lxl. Esse resultado em geral 
e chamado de produto escalar (pois ha apenas um elemento no produto desses 
dois vetores) e muitos autores o tratam como uma escalar (p. ex., Legendre & Le¬ 
gendre, 1998), mas a maioria dos programas estatisticos ira tratar esse resultado 
como uma matriz. 

Dois vetores cujo produto e igual a 0 sao chamados de ortogonais. Por exem¬ 
plo, um par de contrastes a priori ortogonais da ANOVA (ver Capitulo 10) sao 
dois vetores ou numeros, tal que a soma de seus produtos e igual a 0. Em termos 
de algebra de matrizes, o par de contrastes representa um vetor linha e um vetor 
coluna cujo produto das matrizes e 0, e portanto eles sao ortogonais. 


Transposi^ao 

Intercambiar as linhas e colunas da matriz produz sua transposta. Para uma ma¬ 
triz A com dimensoes (m,n), a transposta de A, escrita como A' ou A 1 , tern dimen¬ 
soes ( n,m ) cujo elemento ij e igual ao elemento; i da matriz A: 


3 

-1 

2 



-1 

-2 



(A.5) 


A transposi<;ao de uma matriz transposta recupera a matriz original: (A 1 ) 1 = A. 
Chamamos uma matriz de simetrica se ela nao muda apos sua transposi^ao: 
A 1 = A. Somente matrizes quadradas podem ser simetricas. Os elementos de uma 
matriz quadrada simetrica sao os mesmos nos dois lados da diagonal: 
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12 2-1 
2 4 3 2 

2 3-4 0 

-12 0 8 

Outro exemplo de matriz quadrada simetrica e a de variancia e covariancia 
{ver Capitulo 9, Nota de rodape 5). Para um conjunto de n variaveis, a matriz de 
variancia covariancia nx n contem a covariancia O tj entre as variaveis i ej, com 
a variancia da variavel i, o (i , como elementos da diagonal. Como a covariancia 
de 0,1 = G jP os elementos dos dois lados da diagonal sao identicos e a matriz e 
simetrica. 

Existem duas matrizes simetricas que sao especialmente uteis. A matriz dia¬ 
gonal D e do tipo quadrada, na qual todos os elementos sao iguais a 0, exceto 
aqueles na diagonal principal. 



a \\ 

0 

0 

0 

0 ' 



0 

a 22 

0 

0 

0 


D = 

0 

0 

a 33 

0 

0 

(A.6) 


0 

0 

0 

0 

a nn_ 



A matriz diagonal, cujos elementos sao iguais a 1, e chamada de matriz iden- 
tidade, e geralmente escrita como I: 



"l 

0 

0 

0 

o’ 



0 

1 

0 

0 

0 


1 = 

0 

0 

1 

0 

0 

(A.7) 


0 

0 

0 

0 

1 



Uma matriz e chamada de triangular se todos os elementos em um dos lados 
da diagonal sao iguais a 0. Se todos os elementos acima da diagonal sao iguais a 
zero, ela se chama matriz triangular inferior: 



0 0 

0 0 

2 0 

-2 -1 


(A.8) 
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Em contraste, se todos os elementos abaixo da diagonal forem iguais a zero, 
ela e chamada de matriz diagonal superior: 









’l 

10 

3 

-2 



0 

2 

3 

5 


A = 

0 

0 

2 

-3 

(A.9) 


0 

0 

0 

-1 









Note que a transposi^ao de uma matriz triangular inferior resulta em uma 
triangular superior, e vice-versa. 


InversAo Para uma simples variavel ou escalar k , sabemos que seu inverso k“' e 
definido tal que k x /f 1 = 1. Por analogia, para uma matriz A, definimos seu inver¬ 
so por A~' como sendo a matriz que satisfaz a equa^ao A x A 1 = I, a matriz identi- 
dade. As matrizes inversas sao definidas somente para quadradas, mas nem todas 
as matrizes quadradas possuem inversos. Se A -1 existe, entao AA~' = A 1 A = I. Um 
exemplo de matriz inversa e: 


'l 3' 

-1 

1 

1 

K> 

Ln | 

2 4 


1 

in 

o' 

1 

i-H 

_1 


(A.10) 


Voce pode verificar que essas duas matrizes sao invertidas pela multiplica^ao 
entre elas. Veja que seu produto e a matriz identidade I. Para os casos especiais, 
nos quais o inverso de uma matriz e igual a sua transposta, A = A , a matriz A e 
chamada de ortogonal. O calculo de uma matriz inversa e melhor realizado com 
um programa de matematica ou de estatistica. 

Formas quadrAticas Se combinarmos a transposi^ao com a multiplica^ao de 
matrizes de uma forma particular, obtemos uma expressao chamada de forma 
quadratica. Dada uma matriz quadrada A de dimensoes (n,n) e um vetor coluna 
de dimensoes (n,l), a expressao: 

Q = x t Ax (A.ll) 


e chamada de forma quadratica. Assim, Q e uma matriz lxl com seu elemento 
igual a: 

n n 

(=i j=i 


Q geralmente e considerada uma escalar, embora alguns programas matema- 
ticos e estatisticos possam trata-la como uma matriz lxl. 
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Resolvendo sistemas de equates lineares Uma das mais importantes apli- 
ca^oes da algebra de matrizes e para resolver sistemas de equates lineares. Em 
particular, a estimativa dos parametros (3 () e (3, de um modelo basico de regressao 
linear (ver Capitulo 9) equivale a resolver um sistema de equates lineares: 


r, = + PA, 


r 2 = P 0 + PA 2 


y, = P» + P,^3 

(A.13) 

Y„ = Po + PA 



Se Y e o vetor coluna: 

V 

y 2 

y n _ 

que representa cada uma das n respostas; X e uma matriz n x 2: 

'l X,' 

1 X 2 
1 : 


que representa cada um dos preditores; ebeo vetor coluna: 

'Po" 

de parametros para o modelo de regressao linear, entao o sistema de equates 
lineares (Equa^ao A.13) pode ser representado como Y = Xb. Os valores de (3 0 e (3, 
que fornecem o melhor ajuste para o modelo de regressao (o modelo de mmimos 
quadrados descrito no Capitulo 9) pode ser calculado como: 

b= [X t X]-'[X t Y] (a. 14) 


Esta equa<;ao funciona igualmente bem tanto para a regressao simples como 
para a regressao multipla. 

Autovalores e autovetores Um conjunto especial de equates lineares: 
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jXj + a 12 JC 9 

+ 

'• + Vr Axi 


^21*^1 + ^22^2 

+ .. 

.. + a 2n x n = Ax 2 

(A.15) 

a nl X l + 

+ .. 

.. + a nn x n = Xx n 



pode ser escrito em forma de matrizes como: 


Ax = Ax (A.16) 

onde A e uma matriz quadrada com elementos a-, x e um vetor coluna n x 1, e A 
e uma escalar. Usando as regras de algebra de matrizes ate entao, a Equa^ao A.16 
pode ser re-expressa como: 

(A-Al)x = 0 (A.17) 

onde 0 e um vetor coluna cujos elementos sao todos 0. Se a Equa<;ao A. 17 (ou A. 16 
ou a A. 15) pode ser resolvida (o que nem sempre e o caso), aplicar-se-a somente 
para certos valores de A. Tais valores sao chamados de autovalores da matriz A. 
Como existem n equates na Equa^ao A. 15, pode haver ate n autovalores, que 
podem ser numeros complexos (constantemente) ou numeros reais (de vez em 
quando). Para cada um desses autovalores A,-, ha um autovetor correspondente, 
que e o vetor coluna x, que satisfaz a Equa^o A.16 ou a A.17. Por fim, a soma dos 
autovalores da matriz A e igual ao seu tra$o. 

Determinantes A equa<;ao para calcular os autovalores (Equa^o A.17) tern 
uma solu<;ao trivial quando x = 0 (um vetor coluna com todos os elementos iguais 
a zero). Em adi^ao, a Equa<;ao A.17 tern outra solu^ao: 

|A- Al| = 0 (A.18) 


As duas linhas verticais (| |) na Equa^ao A.18 se referem ao determinante da 
diferen<;a entre as matrizes A e Al. O determinante de uma matriz quadrada A e 
uma escalar, que e calculada a partir da soma de todos os produtos com sinais 
possiveis (positivos e negativos), contendo um elemento da linha e um elemento 
da coluna de A. O sinal de cada produto e determinado por uma regra que pri- 
meiro ira parecer arbitraria. 

A matriz quadrada A tern elementos a t -. Para qualquer produto entre cada 
par de elementos a t) e a km , onde i^kej^m, defmimos o produto como um 
par negativo se um dos elementos estiver posicionado abaixo e a direita do outro. 
Este sera o caso se k > i e m < j. Caso contrario, o produto sera um par positivo. A 
atribui<;ao do sinal pode ser visualizada usando a tabela a seguir: 
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k> i k<i 

m> j 
m <j 



Por exemplo, em uma matriz n x n onde n > 4, o par a }4 e a 22 e positivo, e o 
par a 34 e a 4l e negativo. A atribui^ao dos sinais positivos e negativos aos pares esta 
fundamentada na posi«;ao relativa dos dois elementos dentro da matriz e nao tem 
qualquer rela^ao com o sinal real (positivo ou negativo) dos elementos ou de seu 
produto. 

Existem n elementos da matriz quadrada A, que dois deles caiam ou na 
mesma linha ou na mesma coluna. Um exemplo deles sao os ij p ... , ij n ele¬ 
mentos de A, onde i v ..., i n ej v ... ,j n sao permuta<;6es dos primeiros n numeros 




v 2 y 


pares podem ser formados a partir desses n 


inteiros (1,...» n). Um total de 
elementos. 

Usamos o simbolo Ctjipjp... ; i n ,j n ) para representar o numero desses pares 
negativos. 

O determinante da matriz quadrada A, escrito como |A|, e definido como: 




1=1 


(A.19) 


onde;,,... ,j n e uma permuta^ao dos n primeiros numeros inteiros e o somatorio 
e sobre todas as permuta^oes. 

A receita para calcular o determinante e: 


1 . 


2 . 


3. 


Compare todos os produtos possiveis de cada um dos n fatores que podem 
ser obtidos atraves da escolha de um, e somente um, elemento de cada linha e 
coluna da matriz quadrada A. 


Para cada produto, conte o numero de pares negativos entre os 


V 


v 2 y 


pares que 


podem ser encontrados para os n elementos desse produto. Se par, o sinal do 
produto sera +. Se o numero de pares negativos for um numero impar, o sinal 
do produto sera -. 

Some os produtos com sinal. 


Para uma matriz 2 x 2, o determinante e: 



— #i2#21 


(A.20) 
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Para uma matriz 3 x 3, o determinante e: 


[ 11 

a \2 

fl 13 


'21 

a 22 

fl 23 

~ a ll a 22 a 33 + a 12 a 23 a 3l + a \3 a 2\ a 32 

l 3\ 

a 32 

fl 33 



^11^23^32 a l2 a 21 a 13 a l3 a 22 a 5\ (A.21) 


Como os determinantes podem ser calculados usando tanto as linhas como 
as colunas de uma matriz, o da matriz A e igual ao de sua transposta: |A| = |A'|. 
Uma propriedade util de uma matriz triangular e que seu determinante e igual ao 
produto dos elementos da diagonal principal (ja que todos os outros produtos na 
Equa^ao A. 19 = 0). 

Em adi^ao a explica^ao do mecanismo para identificar autovalores (Equa^ao 
A. 18), os determinantes tern outras propriedades uteis: 

1. Os determinantes transformam o resultado da multiplica^o de matrizes em 
uma escalar: |AB| = |A||B|. 

2. A matriz quadrada cujo determinante e igual a zero nao tern inverso, e e cha- 
mada de matriz singular. 

3. O determinante da matriz e igual ao produto de seus autovalores: 

lAl-ffr 

i =1 

4. Para qualquer escalar k e qualquer matriz nxn, A, \kA\ = k"\A\. 

Como visto no item 2, nem todas as matrizes possuem inverso. Em particular, 
o inverso de uma matriz A"', apenas existe se o determinante de A, |A|, nao for 
igual a 0. 

Decomposk;Ao DE valor singular Uma propriedade util de que qualquer ma¬ 
triz A, m x n, pode ser re-escrita, ou decomposta, usando a formula a seguir: 

A = VWU T (A.22) 


onde V tern as mesmas dimensoes de A (m x n ); U e uma matriz HXn;Ve U sao 
matrizes com colunas ortogonais: as matrizes ortogonais, cujas colunas foram 
normalizadas de forma que a distancia euclidiana de cada coluna e 

j£(yik ~ Yjk ) 2 = 1 

n=i 

e W e uma matriz diagonal n x n cujos valores da diagonal w u sao chamados de 
valores singulares de A. A Equa^ao A.22, conhecida como decomposi^ao de valo¬ 
res singulares, pode ser usada para determinar se uma matriz quadrada A e uma 
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matriz singular. Por exemplo, para resolver o sistema de equates lineares, (A. 14) 
requer a avalia^ao da expressao Y = Xb, onde X e uma matriz quadrada. Como 
mostramos na equa^ao A. 14, a solu^ao de b requer tirar o inverso de X ! X. Para 
simplificar o restante da discussao, iremos escrever X* para representar X*X. 

Usando a Equa^ao A.22, podemos representar X* como VWU 1 . Como o in¬ 
verso do pre-produto de duas matrizes [AB]” 1 e igual ao pos-produto de seus 
inversos A'b’, podemos calcular o inverso de X* como: 

X* -1 = [VWU T ] -1 = [U T ] -1 W _1 V -1 (A.23) 

Como U e V sao ortogonais, seus inversos sao iguais as suas transpostas (que 
sao bem mais faceis de calcular), e: 

X* -1 = UW-‘V T (A.24) 

Alem disso, o inverso da matriz diagonal e apenas uma nova matriz diagonal, 
cujos elementos sao os inversos do original. Se qualquer elemento da diagonal de 
W = 0, entao seus inversos sao infinitos (1/0 = °°) e o inverso de X* nao pode ser 
definido. Assim, podemos determinar com mais facilidade quando X* e singular. 
Ainda e possivel achar solu^ao para a equa«;ao Y = Xb quando X'X for singular, 
usando metodos computacionalmente intensivos (Press et al., 1986). 
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Os numeros entre colchetes indicam o(s) capitulo(s) nos quais acontece a discussao mats completa desses termos. 


abscissa (abscissa) A linha horizontal, ou eixo-x, em 
um grafico. O oposto de ordenada. [7] 
acuracia (accuracy) O grau em que a medida de um 
objeto se aproxima do seu valor real. Comparar com 
precisao. [2] 

agrupamento aglomerativo (agglomerative clustering) 
O processo de agrupar objetos pegando grupos 
menores e os agrupando em grupos maiores, com 
base em sua similaridade. Ver tambem analise de 
agrupamento. Comparar com agrupamento divi- 
sivo. [12] 

agrupamento divisivo (divisive clustering) O pro¬ 
cesso de agrupar objetos a partir da divisao de um 
grande grupo, com base na dissimilaridade, em ou- 
tros sucessivamente menores. Ver tambem analise 
de agrupamentos. Comparar com agrupamento 
aglomerativo. [12] 

agrupamento hierarquico (hierarchical clustering) Um 
metodo para agrupar objetos que se baseia na im- 
posi^ao de um sistema de referenda externo. Em 
agrupamentos hierarquicos, se a e b estao em um 
grupo e as observances ced estao em outro um gru¬ 
po maior que inclui aec, tambem deve incluir bed. 
A taxonomia linneana e um exemplo de um sistema 
de agrupamento hierarquico. [12] 
agrupamento nao hierarquico (non-hierarchical cluste¬ 
ring) Um metodo para agrupar objetos que nao e 
fundamentado em um sistema de referenda exter¬ 
no. Comparar com agrupamento hierarquico. [12] 
agrupamento por K-medias (K-means clustering) Um 
metodo nao hierarquico de agrupar objetos que mi- 
nimiza a soma dos quadrados das distancias de cada 
objeto ate o centroide de seu grupo. [12] 
ajuste (fit) Quao consistentes as predi^oes sao em 
rela^ao ao observado. Usado para descrever quao 
bem os dados sao preditos por um dado modelo, 
ou quao bem os modelos sao preditos pelos dados 
disponiveis. [9,10,11,12] 


alfa (alpha) A primeira letra (a) do alfabeto grego. 
Na estatistica, ela e usada para denotar uma proba- 
bilidade aceitavel de cometer um erro Tipo I. [4] 
amostra (sample) Um subconjunto da popula^ao 
de interesse. Como e praticamente impossivel ob¬ 
server ou manipular todos os individuos em uma 
popula^ao, as analises baseiam-se em amostras da 
popula^ao. A probabilidade e a estatistica sao utili- 
zadas para extrapolar os resultados a partir de uma 
amostra pequena para uma popula^ao maior. [ 1 ] 
analise de agrupamento (cluster analysis) Um me¬ 
todo para agrupar objetos com base em distancias 
multivariadas entre eles. [12] 
analise de caminhos (path analysis) Um metodo 
para atribuir causas e efeitos multiplos e sobrepos- 
tos em um tipo especial de modelo de regressao 
multipla. [9] 

analise de componentes principais (PCA - principal 
component analysis) Um metodo de ordena^ao 
que reduz dados multivariados a um numero me- 
nor de variaveis pela cria^ao de combina^oes linea- 
res das variaveis originais. Foi originalmente desen- 
volvida para atribuir identidade racial a individuos 
com base em multiplas medidas biometricas. [12] 
analise de coordenadas principais (PCoA - Principal 
coordinate analysis) Um metodo de ordena^ao 
generico que pode usar qualquer medida de distan- 
cia. A analise de componentes principais e a analise 
fatorial (por exemplo) sao casos especiais de uma 
analise de coordenadas principais. [12] 
analise de correspondence (correspondence analysis) 
Um metodo de ordena<;ao usado para relacionar a 
distribui^ao de especies a variaveis ambientais. Tam¬ 
bem chamada de “analise de gradiente indireta”. [12] 
analise de correspondence canonica (CCA - canonical 
correspondence analysis) Um metodo de ordena- 
<;ao, tipicamente usado para relacionar a abundan- 
cia ou as caracteristicas de especies com variaveis 
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ambientais ou do habitat. Esse metodo ordena 
linearmente os preditores (variaveis ambientais ou 
do habitat) e as respostas (dados das especies) para 
produzir eixos unimodais, ou de corcova, relativos 
aos preditores. Ela tambem e um tipo de analise de 
regressao multivariada. Comparar com a analise de 
redundancia.[12] 

analise de correspondencia destendenciada (detrended 
correspondence analysis) Uma varia^ao da analise 
de correspondencia usada para melhorar (remover) 
o efeito do arco. [12] 

analise de covariancia (ANCOVA - analysis of co- 
variance) Um modelo estatistico hibrido, algo 
entre regressao e ANOVA, que inclui uma variavel 
preditora continua (a covariavel) em conjunto a 
uma variavel preditora categorica de um modelo de 
ANOVA. [10] 

analise de dados grafica exploratoria (EDA -graphical 
exploratory data analysis) O uso de estruturas 
visuais, como graficos, para detectar padroes, dados 
discrepantes e erros nos dados. [8] 
analise de interven^ao randomizada (randomized in¬ 
tervention analysis) Uma tecnica de Monte Carlo 
para a analise de delineamentos ADCI. [7] 
analise de Monte Carlo ( Monte Carlo analysis) Umas 
das tres grandes estruturas de analises estatisticas. Ela 
usa metodos de Monte Carlo para estimar valores de 
P. Ver metodos de Monte Carlo. Comparar com infe- 
rencia bayesiana e analises parametricas. [5] 
analise de redundancia (RDA - redundance analysis) 
Um tipo de regressao multipla usado quando tanto 
a variavel preditora quanto a variavel resposta sao 
multivariadas. Diferente da semelhante analise de 
correspondencia canonica, a analise de redundan¬ 
cia nao faz nenhuma premissa acerca da forma dos 
eixos preditores ou resposta. [12] 
analise de tabela de contingency (contingency table 
analysis) Os metodos estatisticos usados para 
analisar conjuntos de dados em que tanto a variavel 
resposta quanto a preditora sao categoricas. [7,11 ] 
analise de variancia (ANOVA - analysis of variance) 
Um metodo de parti^ao da soma dos quadrados, 
creditada a Fisher. E usada primariamente para 
testar a hipotese nula estatistica de que tratamentos 
distintos nao possuem efeitos sobre uma variavel 
resposta medida. [5,9,10] 
analise de variancia multivariada (MANOVA - mul¬ 
tivariate analysis of variance) Um metodo para 
testar a hipotese nula de que os vetores medios de 
multiplos grupos sao todos iguais uns aos outros. 
Uma ANOVA para dados multivariados. [12] 


analise discriminante (discriminant analysis) Um 
metodo para classificar observances multivariadas 
quando os grupos foram definidos com anteceden- 
cia. A analise discriminante tambem pode ser usada 
como um teste post hoc para detectar diferen^as 
entre grupos quando analise de variancia multi¬ 
variada (MANOVA) tenha produzido resultados 
significativos. [12] 

analise fatorial (factor analysis) Um metodo de 
ordena^ao que re-escala cada observa^ao original 
como uma combina^ao linear de um numero me- 
nor de parametros, chamados de fatores comuns. 
Foi desenvolvida no comedo do seculo 20 como 
forma de calcular a “inteligencia geral” a partir de 
uma bateria de testes com pontua^ao. [12] 
analise parametrica (parametric analysis) Uma das 
tres principals estruturas de analises estatisticas. 

Ela recai sobre o requisito de que os dados foram 
tirados de uma variavel aleatoria com distributes 
de probabilidade definidas por parametros fixos. 
Tambem e chamada de analise frequentista ou 
estatistica frequentista. Comparar com inferencia 
bayesiana e analises de Monte Carlo. [5] 

ANCOVA Ver analise de covariancia. [10] 

ANOVA Ver analise de variancia. [5,9,10] 

ARIMA Ver autorregressivo integrado de medias 
moveis. [7] 

arquivos simples (flat files) Arquivos de computador 
que contem dados organizados em forma de tabela 
com apenas 2 dimensoes (linhas e colunas). Cada 
dado e colocado em uma celula diferente. [8] 
arvore de classifica^ao (classification tree) Um mo¬ 
delo ou exibinao visual de dados categoricos que e 
construido dividindo o conjunto de dados em gru¬ 
pos sucessivamente menores. A divisao continua 
ate que nenhuma melhora no ajuste do modelo 
seja obtida. Uma arvore de classifica^ao e analoga a 
uma chave taxonomica, exceto que as divisoes em 
uma arvore de classifica^ao refletem probabilidades 
e nao identidades. Ver tambem diagrama de agru- 
pamento; impureza, arvore de regressao. [11] 
arvore de regressao (regression tree) Um modelo, 
ou representa^ao visual, de dados continuos que 
e construido por meio da divisao do conjunto de 
dados em grupos sucessivamente menores. A divi¬ 
sao continua ate que nenhuma melhora no ajuste 
do modelo seja obtida. Uma arvore de regressao 
e analoga a uma chave taxonomica, exceto que as 
divisoes em uma arvore de regressao refletem pro¬ 
babilidades, e nao identidades. Ver tambem arvore 
de classifica^ao; diagrama de agrupamento. [11] 
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arvore logica ( logic tree) Um exemplo do metodo 
hipotetico-dedutivo. O investigado trabalho ao 
longo de uma arvore logica escolhendo entre uma 
de duas alternativas a cada ponto de decisao. A 
arvore vai do geral (p. ex., animal ou vegetal) para o 
especlfico (p. ex., 4 dedos ou 3?). Quando nao res¬ 
tar mais escolhas, a solu^ao foi obtida. Uma chave 
dicotomica e um exemplo de arvore logica. [4] 
assimetria ( skewness ) A descri^ao de quao longe 
uma distribuinao esta de ser simetrica. Abreviada 
como g, e calculada a partir do terceiro momento 
central. Ver tambem assimetria a direita e assime¬ 
tria a esquerda. [3] 

assimetria a direita (right-skewed) Uma distribuinao 
que tern a maioria de suas observances inferiores a 
media aritmetica, mas uma longa cauda de observa¬ 
nces superiores a media aritmetica. A assimetria de 
uma distribuinao com assimetria a direita e maior 
que 0. Comparar com assimetria a esquerda. [3] 
assimetria a esquerda ( left-skewed) Uma distribuinao 
que tern a maioria de suas observances superiores a 
media aritmetica, mas uma longa cauda de observa¬ 
nces inferiores a media aritmetica. A assimetria de 
uma distribuinao com assimetria a esquerda e infe¬ 
rior a 0. Comparar com assimetria a direita. [3] 
associanao (associative) Em matematica, e a pro- 
priedade de que (a + b) + c = a + (b + c). [A] 
autorregressivo (autoregressive) Um modelo esta- 
tistico em que a variavel resposta ( Y) depende de 
um ou mais valores previos. Muitos modelos do 
crescimento populacional sao autorregressivos, 
como, por exemplo, aqueles nos quais o tamanho 
da populanao no tempo t + 1 e dependente do da 
populanao no tempo t. [6] 

autorregressivo integrado de medias moveis (ARIMA 

- autoregressive integrated moving average) Um 
modelo estatistico usado para analisar dados de se¬ 
ries temporais que incorpora tanto a dependencia 
temporal nos dados (Ver autorregressivo) quanto 
os parametros que estimam as mudannas devido 
aos tratamentos experimentais. [7] 
autovalor (eigenvalue) A solunao ou as solunoes para 
um conjunto de equanoes lineares de forma Ax = Ax. 
Nesta equanao, A e uma matriz quadrada exe um 
vetor coluna. O autovalor e a escalar, ou um unico 
numero, X. Comparar com autovetor. [12] 
autovetor (eigenvector) O vetor coluna x que resolve 
o sistema de equanoes lineares Ax = Ax. Comparar 
com autovalor. [12] 

axioma (axiom) Um principio (matematico) estabe- 
lecido que e universalmente aceito, verdadeiro por 
autoevidencia e nao necessita de provas formais. [ 1 ] 


base (base) A funnao logaritmica log^a = X e des- 
crita por dois parametros, aeb y tal que b x = ae 
equivalente a \og b a = X. O parametro be a base do 
logaritmo. [8] 

beta (beta) A segunda letra (p) do alfabeto grego. 

Na estatistica, e usada para representar a probabili- 
dade aceitavel de cometer um erro Tipo II. Ela tam¬ 
bem aparece, com subscritos, como simbolo para 
os coeficientes e parametros de regressao. [4] 

BIC Ver criterio de informanao bayesiano. [9] 
bi-plot (bi-plot) Um unico grafico dos resultados de 
duas ordenanoes relacionadas. Comumente usado 
para ilustrar os resultados da analise de corres¬ 
pondence, analise de correspondence canonica e 
analise de redundance. [12] 
bloco (block) Uma area, ou um intervalo de tempo, 
dentro da qual fatores nao manipulados experi- 
mentalmente sao considerados homogeneos. [7] 
bondade do ajuste (goodness-of-fit) Grau com que 
um conjunto de dados e acuradamente predito por 
uma dada distribuinao ou modelo. [11] 
bootstrap (bootstrap) Na lingua inglesa, a palavra 
bootstrap significa “rneios para conseguir algo com 
seu proprio esforno, sem ajuda de mais ninguem”. 
Na estatistica, o bootstrap e um procedimento 
de aleatorizanao (ou Monte Carlo), no qual as 
observances em um conjunto de dados sao rea- 
mostradas com reposinao a partir do conjunto de 
dados original, e o conjunto de dados reamostrado 
e entao usado para recalcular a estatistica teste de 
interesse. Isto e repetido um grande numero de ve- 
zes (em geral 1.000 - 10.000, ou mais). A estatistica 
teste que foi calculada com o conjunto de dados 
original e comparada com a distribuinao daquela 
resultante das repetidas reamostragens dos dados, 
para obter um valor de P exato. Ver tambem jackk¬ 
nife. [5] 

box plot (boxplot) Uma ferramenta visual que 
ilustra a distribuinao de um conjunto de dados 
univariado. Ilustra a mediana, os quartis superior 
e inferior, os decis superior e inferior, e qualquer 
discrepancia (outlier).[ 8] 


calculo de probabilidade (probability calculus) A ma¬ 
tematica usada para lidar com probabilidades. [ 1 ] 
carga (loadings) Em uma analise de componentes 
principals, os parametros que sao multiplicados 
por cada variavel de uma observanao multivariada 
para gerar uma nova variavel, ou escore de com- 
ponente principal para cada observanao. Cada um 
desses escores e uma combinanao linear das varia- 
veis originais. [12] 
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carga dos fatores {factor loadings) Os coeficientes 
lineares com que os fatores comuns em uma analise 
fatorial sao multiplicados para obter uma estimati- 
va da variavel original. [12] 
casual ( haphazard ) Atribui^ao de individuos ou 
populates a grupos de tratamentos que nao e 
verdadeiramente aleatoria. Comparar com rando- 
miza^ao. [6] 

CCA Ver analise de correspondence canonica. [12] 
celula (cell) Um campo em uma planilha. E identi- 
ficada pelo numero de sua linha e coluna e contem 
um unico valor, ou dado. [8] 
centroide {centroid) O vetor medio de uma variavel 
multivariada. Pense nele como o centro de uma 
nuvem de pontos no espa^o multivariado, ou o 
ponto em que voce poderia equilibrar essa nuvem 
de pontos na ponta de uma agulha. [12] 
circularidade {circularity) A premissa da analise de 
variancia de que a varia<;ao entre amostras dentro 
de subparcelas ou blocos e a mesma ao longo de 
todas as subparcelas ou blocos. [7] 
classifica^ao {classification) O processo de posicio- 
nar, colocar em grupos. Um termo geral para os 
metodos multivariados, como a analise de agrupa- 
mento ou a analise discriminante, que estao preo- 
cupados em agrupar observances. Comparar com 
ordena^ao. [12] 

coeficiente binomial {binomial coefficient) A cons- 
tante pela qual multiplicamos a probabilidade de 
uma variavel aleatoria de Bernoulli para obter uma 
variavel aleatoria binomial. O coeficiente binomial 
ajusta a probabilidade para levar em conta multi- 
plas combinanoes equivalentes de cada um dos dois 
resultados possiveis. Ele e escrito como: 



e e lido como “n sobre X” E calculado como: 
n\ 

X\{n-X)\ 

onde “!” indica o fatorial. [2] 
coeficiente de caminhos {path coefficient) Um tipo 
de parametro de regressao parcial calculado na 
analise de caminhos que indica a magnitude e o 
sinal de efeito de uma variavel sobre outra. [9] 
coeficiente de correla^ao produto-momento ( r) {pro¬ 
duct-moment correlation coefficient) Uma medida 
de quao bem duas variaveis sao relacionadas uma 
com a outra. Ele pode ser calculado como a raiz 


quadrada do coeficiente de determina^ao, ou como 
a soma dos produtos cruzados dividida pela raiz 
quadrada do produto da soma dos quadrados das 
variaveis X e Y. [9] 

coeficiente de determinant (r 2 ) {coefficient of de¬ 
termination) A quantidade de variabilidade da 
variavel resposta, que e explicada por um modelo 
de regressao linear simples. £ igual a soma dos 
quadrados da regressao dividida pela soma dos 
quadrados total. [9] 

coeficiente de dispersao {coefficient of dispersion) A 
quantidade obtida pela divisao da variancia da 
amostra pela media da amostra. O coeficiente de 
dispersao e usado para determinar se os individuos 
distribuidos com padrao espacial agregado, regular, 
aleatorio ou hiperdisperso. [3] 
coeficiente de variant (CV) {coefficient of variation) 

A quantidade obtida pela divisao do desvio padrao 
da amostra pela media da amostra. O coeficiente de 
varia^ao e util para comparar a variabilidade entre 
diferentes populates, pois foi ajustada (padroniza- 
da) para a media da popula^ao. [3] 
colinearidade {collinearity) A correla^ao entre duas 
variaveis preditoras. Ver tambem multicolineari- 
dade. [7,9] 

combina^ao {combination) A organiza^ao de n ob- 
jetos discretos com X objetos a cada vez. O numero 
de combina^oes de um grupo de n objetos e calcu¬ 
lado usando o coeficiente binomial. Comparar com 

permuta^ao. [2] 

combina^ao linear {linear combination) A re-expres- 
sao de uma variavel como a combinanao de outras, 
cujos parametros da nova expressao sao lineares. Por 
exemplo, a equa^ao Y = b qX 0 + b x X x + bfX 2 expressa 
a variavel Y como uma combina^ao linear de X 0 a 
X 2 , pois os parametros b 0 > b x e b 2 sao lineares. Em 
contraste, a equa^ao Y - afX^ + Xf\ nao e uma com- 
bina^ao linear, pois o parametro a x e exponencial, 
e nao linear. Note que a segunda equa^ao pode ser 
transformada em uma combina^ao linear, tirando os 
logaritmos de ambos lados da equa^ao. Nem sempre 
sera o caso, entretanto, que combina^oes nao linea¬ 
res possam ser transformadas em lineares. [12] 
complemento {complement) Na teoria de conjuntos, 
o complemento A L de um conjunto A e tudo que 
nao esta incluido no conjunto A. [ 1 ] 
completamente cruzados {fully crossed) Um deli- 
neamento de analise de variancia multifatorial em 
que todos os niveis de dois ou mais tratamentos 
sao testados ao mesmo tempo em um unico expe- 
rimento. [7,10] 
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completo ( exhaustive ) Um conjunto de resultados e 
dito completo se inclui todos os resultados possi- 
veis de um evento. Comparar com exclusivo. [ 1 ] 
componente de varia^ao (component of variation) 
Quanto cada fator, em um modelo de analise de 
variancia, explica da variabilidade dos dados ob- 
servados. Inicialmente, a varia^ao total nos dados 
pode ser fracionada em varia^ao entre grupos e em 
varia^ao dentro de grupos. Em alguns delineamen- 
tos de ANOVA, a varia^ao pode ser fracionada em 
componentes adicionais. [10] 
componentes principals ( principal components) Os 
eixos principal ordenados pela quantidade de va¬ 
riabilidade que eles carregam do conjunto original 
de dados. [12] 

comutativo ( commutative) Em matematica, e a pro- 
priedade de que a + b = b + a. [ A] 
confundido ( confounded) A consequencia de uma 
variavel medida estar associada a outra variavel que 
pode nao ter sido medida ou controlada. [4,6] 
conjunto {set) Uma cole^ao de objetos discretos, 
consequencias ou resultados. Os conjuntos sao 
manipulados usando as operates de uniao, inter- 
se^ao e complemento. [ 1 ] 

conjunto vazio Um conjunto sem membros ou ele- 
mentos. [ 1 ] 

conjuntos discretos ( discrete sets) Um conjunto de 
resultados discretos. [ 1 ] 

contraste ( contrast) A compara^ao entre grupos de 
tratamentos em um delineamento de ANOVA. Os 
contrastes se referem as compara^oes decididas an¬ 
tes de um experimento ser realizado. [10] 
correla^ao ( correlation ) O metodo de analises 
usado para explorar relates entre duas variaveis. 
Na analise de correla^ao, nenhuma hipotese sobre 
rela^ao de causa e efeito e criada. Comparar com 
regressao. [7, 9] 

correlativo ( correlative) Um tipo de relates que e 
observado, mas que ainda nao foi investigado ex- 
perimentalmente de forma controlada. A existencia 
de dados correlativos leva a expressao “correla^ao 
nao implica causa”. [4] 

covariavel ( covariate) Uma variavel continua que e 
medida em cada replica em um delineamento de 
analise de covariancia. A covariavel e usada para 
explicar a varia<;ao residual nos dados e aumentar 
o poder do teste em detectar diferen^as entre trata¬ 
mentos. [10] 

covariancia ( covariance) A soma do produto das 
diferen^as entre cada observa^ao e seu valor espe- 
rado, dividido pelo tamanho amostral. Se a cova¬ 


riancia nao for dividida pelo tamanho amostral, e 
chamada de soma dos produtos cruzados. [9] 
criterio de informa^ao ( information criterion) Qual- 
quer metodo para selecionar entre modelos esta- 
tisticos que leve em conta o numero de parametros 
nos diferentes modelos em geral qualificados 
(como no criterio de informa^ao de Akaike ou cri¬ 
terio de informa^ao bayesiano). [9] 
criterio de informa^ao bayesiano (BIC - Bayesian in¬ 
formation criterion) Um metodo para comparar 
as distributes de probabilidades a posteriori de 
dois modelos alternatives quando a de probabilida¬ 
des a priori nao e informativa. Ele desconta o fator 
de Bayes pelo numero de parametros em cada um 
dos modelos. Como com o criterio de informa^ao 
de Akaike, esse modelo e considerado o melhor. [9] 
criterio de informa^ao de Akaike (AIC - Akaike s in¬ 
formation criterion) Uma medida do poder expli- 
cativo de um modelo estatistico que leva em conta 
o numero de parametros no modelo. Ao comparar 
muitos modelos para um mesmo fenomeno (os 
modelos devem compartilhar no minimo alguns 
parametros), o modelo com o menor valor do cri¬ 
terio de informa^ao de Akaike e considerado o me¬ 
lhor. Usado comumente para sele^ao de modelos 
em regressao e analise de caminhos. [9] 
curtose ( kurtosis) Uma medida de quao agregada ou 
dispersa uma distribui^ao e relativa a seu centro. 

E calculada usando o quarto momento central e e 
simbolizada por g 2 . Ver tambem platicurtica e lep- 
tocurtica. [3] 

CV Ver coeficiente de varia^ao. [3] 


dados bivariados ( bivariate data) Dados que con- 
sistem de duas variaveis para cada observa^ao. Em 
geral sao ilustrados em graficos de dispersao. [8] 
dados multivariados {multivariate data) Os dados 
consistem de mais de duas variaveis para cada 
observa^ao. Com frequencia sao ilustrados usan¬ 
do matrizes de graficos de dispersao ou outras 
ferramentas de visualiza^ao em mais dimensoes. 
[ 8 , 12 ] 

dados univariados {univariate data) Os dados con¬ 
sistem de uma unica medida para cada observa^ao. 
Muitas vezes sao ilustrados usando box plots , histo- 
gramas ou graficos de caule-e-folhas. [8,12] 
decil {decile) Um decimo. Em geral refere-se aos de- 
cis superior e inferior - os 10% superiores e os 10% 
inferiores - de uma distribui^ao. [3] 
decomposi^ao {decomposition) Em algebra de ma¬ 
trizes, e a re-expressao de qualquer matriz m x n A 
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conforme o produto de tres matrizes, VWU 1 , onde 

V e uma matriz com as mesmas dimensoes de A, 

U e W sao matrizes quadradas (dimensao nxn); 

V e U sao matrizes de colunas ortonormais; e W 
e uma matriz diagonal com valores singulares na 
diagonal. [A] 

dedu^ao ( deduction ) O processo de raciodnio 
cientifico que progride do geral (todos os cisnes 
sao brancos) para o espedfico (esta ave, sendo um 
cisne, e branca). Comparar com indu^ao. [4] 
delineamento ADCI ( BACI design) Um metodo 
experimental para avaliar os efeitos de um trata- 
mento (frequentemente um impacto ambiental ad- 
verso) em rela<^ao a uma popula^ao sem amea^as. 
Nos delineamentos ADCI (Antes-Depois-Contro- 
le-Impacto) com frequencia ha pouca replica^ao 
espacial, portanto a replica^ao e temporal. O efeito 
nas populates controle e nas populates amea- 
^adas sao medidos tanto antes quanto depois do 
tratamento. [6, 7] 

delineamento aditivo ( additive design) Um delinea¬ 
mento experimental usado para estudar competi^ao 
entre uma especie de interesse alvo, ou focal, e seus 
competidores. Em um delineamento aditivo, a den- 
sidade da especie-alvo e mantida constante e os di- 
ferentes tratamentos representam diferentes nume- 
ros de competidores. Comparar com delineamentos 
substitutivos e de superficie de resposta. [7] 
delineamento aninhado ( nested design) Qualquer 
delineamento de analise de variancia em que ha 
subamostragem dentro das replicas. [7,10] 
delineamento com parcelas subdivididas ( split-plot 
design) Um delineamento de analise de variancia 
multifatorial em que cada parcela experimental e 
subdividida em subparcelas, e cada uma recebe um 
tratamento diferente. [7,10] 
delineamento com um fator (single factor design) De¬ 
lineamento de analise de variancia que manipula 
apenas uma variavel. Comparar com delineamento 
multifatorial. [7] 

delineamento de analise de variancia ( analysis of 
variance designs) A classe de configurates ex¬ 
perimental usada para explorar relates entre 
variaveis preditoras categoricas e variaveis resposta 
continuas. [7] 

delineamento de blocos aleatorizados ( randomized 
block design) Um delineamento de analise de 
variancia em que conjuntos de replicas, e todos os 
niveis dos tratamentos, sao dispostos em uma area 
fisica no espa^o ou em um ponto fixo no tempo 
(um bloco), no intuito de reduzir a variabilidade 
nas condi^oes nao manipuladas. [7,10] 


delineamento de dois fatores (two-way design) Um 
delineamento de ANOVA com dois efeitos princi¬ 
pal em que cada um deles tern dois ou mais niveis 
de tratamento. [7,10] 

delineamento de medidas repetidas (repeated measu¬ 
res design) Um tipo de ANOVA em que multiplas 
observac^oes sao feitas em uma mesma replica indi¬ 
vidual, em diferentes pontos no tempo. [7,10] 
delineamento de regressao (regression design) A 
classe de esbo<;o experimental usado para explorar 
relates entre variaveis preditoras continuas e va¬ 
riaveis resposta continuas ou categoricas. [7] 
delineamento de superficie de resposta (response 
surface design) Um delineamento experimental 
usado para estudar competi^ao entre uma especie 
de interesse alvo, ou focal, e seus competidores. Em 
um delineamento de superficie de resposta, a den- 
sidade da especie-alvo e de seus competidores sao 
variadas sistematicamente. Os delineamentos de 
superficie de resposta tambem podem ser usados 
em vez de ANOVA quando os fatores sao melhor 
representados como variaveis continuas. Comparar 
com delineamento aditivo e delineamento substi- 
tutivo. [7] 

delineamento fatorial (factorial design) Um delinea¬ 
mento para analise de variancia que inclui todos os 
niveis dos tratamentos (ou fatores) de interesse. [7] 
delineamento multifatorial (multi-factor design) De¬ 
lineamento de analise de variancia que inclui dois 
ou mais tratamentos ou fatores. [7] 
delineamento substitutivo (substitutive design) Um 
delineamento experimental usado para estudar a 
competi^ao entre uma especie de interesse-alvo, ou 
focal, e seus competidores. Em um delineamento 
substitutivo, a densidade total da especie-alvo e de 
seus competidores e mantida constante em certo 
nivel, mas a propor^ao relativa da especie-alvo e 
seus competidores e variada sistematicamente. 
Comparar com delineamento aditivo e com deli¬ 
neamento de superficie de resposta. [7] 
dendrograma (dendrogram) Um diagrama (grama) 
de arvore (dendro). Um metodo de representar 
graficamente os resultados de uma analise de agru- 
pamentos. Em principio, e similar a uma arvore de 
classifica^ao. Tambem e muito usado para ilustrar a 
rela^ao entre especies (filogenias). [12] 
desigualdade triangular (triangle inequality) Para 
tres objetos multivariados, a, bee, a distancia entre 
a e b mais a entre bee sempre e maior que, ou igual 
a, distancia entre a ec. [12] 
destendenciada (unbiased) A propriedade estatis- 
tica de medidas, observa^oes ou valores nao serem 
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nem consistentemente muito grandes nem muito 
pequenas. Ver tambem acuracia e precisao. [2] 
desvio ( deviation ) Diferen<;a entre a predi^ao do 
modelo e dos valores observados. [6] 
desvio padrao (DP) ( standard deviation - sd) Uma 
medida de dispersao. Igual a raiz quadrada da va¬ 
riancia. [3] 

desvio padrao amostral (sample standard deviation) 
Uma estimativa, sem vies, do desvio padrao de uma 
amostragem. Igual a raiz quadrada da variancia 
amostral. [3] 

determinante ( determinant ) Em algebra de matri- 
zes, e a escalar calculada como a soma de todos os 
produtos possiveis, contendo um elemento na linha 
e um na coluna de uma dada matriz. [A] 
diagrama de Venn ( Venn diagram) Um grafico usa- 
do para ilustrar as operates de uniao, intercessao e 
complemento de conjuntos. [11] 
dimensao ( dimension) Um vetor bidimensional es- 
pecificando o numero de linhas e o de colunas em 
uma matriz. [A] 

discrepancias (outliers) Dados inesperadamente 
grandes ou pequenos. [3, 8] 
dispersao (spread) Uma medida da varia^ao dentro 
de um conjunto. [3] 

dissimilaridade (dissimilarity) Quao diferentes dois 
objetos sao. Normalmente quantificados com uma 
distancia. [12] 

distancia (distance) Quao separados dois objetos 
estao. Ha muitas formas para medir distancias, a 
mais familiar e a distancia euclidiana. [12] 
distancia euclidiana (Euclidean distance) Uma medi¬ 
da de distancia ou dissimilaridade entre dois obje¬ 
tos. Se cada objeto pode ser descrito por um conjun¬ 
to de coordenadas em um espa^o n-dimensional, a 
distancia euclidiana pode ser calculada como: 

d hj=jl£sy.,k-y j ,k) 2 [i2] 

distribute) de probabilidades (probability distribution) 
A distribui^ao de resultados X { de uma variavel 
aleatoria X. Para variaveis aleatorias continuas, a dis¬ 
tribute de probabilidades e uma curva suave e um 
histograma apenas e uma aproxima^ao da distribui- 
$ao de probabilidades. [2] 

distribute) de probabilidades a posteriori (posterior 
probability distribution) A distribui^ao resultante 
da aplica^ao do Teorema de Bayes a um determi- 
nado conjunto de dados. Essa distribui<;ao da a 
probabilidade para o valor de qualquer hipotese de 
interesse conforme os dados observados. [5,1] 


distribute) de probabilidades a priori (prior proba¬ 
bility distribution) Uma de duas distributes (a 
outra e a verossimilhan 9 a) usada no numerador 
do Teorema de Bayes para calcular a distribui^ao 
de probabilidades a posteriori. Ela define a pro¬ 
babilidade para o valor de qualquer hipotese de 
interesse antes que os dados sejam coletados. Ver 
tambem probabilidade a priori e verossimilhan- 
?a- [5,9] 

distribui^ao-F (F- distribution) A distribui<;ao espe- 
rada de uma variavel aleatoria F, calculada como 
uma variancia (em geral a soma dos quadrados 
entre grupos ou SQ entregrupos ) dividida por outra (ge- 
ralmente a soma dos quadrados dentro de grupos, 

OU SQdentro de grupos)’ 

distribute* normal padrao (standard normal distribu¬ 
tion) Uma distribute normal de probabilidades 
com media = 0 e variancia = 1. [2] 
distributo-f (t-distribution) Uma modifica^ao da 
distribuito de probabilidades normal padrao. Para 
tamanhos amostrais pequenos, a distributo-f e 
leptocurtica, mas, conforme o tamanho amostral 
aumenta, a distributo-f se aproxima de uma 
distributo normal padrao. As probabilidades de 
cauda da distributo-f sao usadas para calcular 
intervalos de confian^a. [3] 
distributivo (distributive) Em matematica, e a pro- 
priedade de que c(a + b) = ca + cb. [A] 
dobrad t (hinge) A posto dos quartis superior e 
inferior em um grafico de caule-e-folha. [8] 

DP Ver desvio padrao. [3] 


EDA Ver analise de dados exploratoria usando 
graficos. [8] 

efeito do arco (horseshoe effect) Uma propriedade 
indesejavel de muitos metodos de ordena^ao que 
acabam exagerando a media e comprimindo os 
extremos de um gradiente ambiental. Ele leva a um 
grafico de ordena^ao que e curvo, em forma arco, 
ferradura, ou circulos. [12] 
efeito principal (main effect) O efeito individual de 
uma unica variavel. Na ausencia de qualquer inte- 
ra^ao os efeitos principals sao aditivos: a resposta 
de um experimento pode ser acuradamente predita 
conhecendo-se os efeitos principals de cada fator 
individual. Comparar com intera^ao. [7,10] 
efeitos aleatorios (random effects) Em um delinea- 
mento de analise de variancia, o conjunto de niveis 
de tratamento que representam uma variavel, um 
subconjunto aleatorio de todos os niveis de trata¬ 
mento possiveis. Tambem conhecido como fator 
aleatorio. Comparar com efeitos fixos. [7,10] 
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efeitos fixos {fixed effects) Em um delineamento de 
analise de variancia, o conjunto de niveis dos trata- 
mentos que representa todos os niveis de tratamen- 
tos possiveis. Tambem conhecido como fator fixo. 
Comparar com efeitos aleatorios. [7,10] 
eixo maior ( major axis) Em uma analise de compo- 
nentes principais, e o primeiro eixo principal. Alem 
disso, e o eixo mais longo de uma elipse. [12] 
eixo principal ( principal axis) Uma nova variavel 
criada por uma ordena^ao em que as variaveis ori¬ 
ginal sao ordenadas. [12] 
eixo-x {x-axis) A linha horizontal em um grafico, 
tambem chamado de abscissa. O eixo-x em geral 
representa a variavel causal, independente ou pre- 
ditora em um modelo estatistico. [1] 
eixo-y {y-axis) A linha vertical em um grafico, tam¬ 
bem chamado de ordenada. O eixo-y geralmente 
representa o resultado ou variavel dependente ou 
resposta em um modelo estatistico. [ 1 ] 
elemento ( element ) Um valor em uma matriz. Na 
maioria das vezes e indicado com a ijy onde i ej sao 
os numeros da linha e da coluna, respectivamente, 
da matriz. [12] 

elimina^ao regressiva {backward elimination) Um 
metodo de regressao gradativa em que voce come^a 
com um modelo contendo todos os parametros 
possiveis e os elimina um por vez. Ver tambem re¬ 
gressao gradativa {stepwise regression ); comparar 
com sele^ao progressiva {forward selection). [9] 
erro {error) Um valor que nao representa a medida 
ou observa^ao original. Ele pode ser causado por 
desaten^ao no campo, instrumentos com mau 
funcionamento ou erros de digita^ao cometidos ao 
transferir os dados do caderno de campo ou folhas 
de dados para as planilhas. [8] 
erro-padrao da media {standard error of the mean) 
Uma estimativa assintotica do desvio padrao da 
popula<^ao. Com frequencia apresentada em publi- 
ca<;oes em vez do desvio padrao amostral. O erro 
padrao da media e menor que o amostral e pode 
dar a falsa impressao de menos variabilidade nos 
dados. [3] 

erro-padrao da regressao {standar error of regression) 
Para um modelo de regressao, a raiz quadrada da 
soma dos quadrados dos residuos dividida pelos 
graus de liberdade do modelo. [9] 
erro Tipo I ( Type I error) Rejei^ao erronea de uma 
hipotese nula estatistica verdadeira. Em geral, e in¬ 
dicado pela letra grega alfa (a). [4] 
erro Tipo II ( Type II error) Aceitar incorretamente 
uma hipotese nula estatistica que e falsa. Em geral, 


indicado pela letra grega beta (p). O poder estatis¬ 
tico e igual a 1 - p. [4] 

escalar {scalar) Um unico numero, nao uma ma¬ 
triz. [A] 

escalonamento multidimensional nao metrico (NMDS 

- non-metric multidimensional scaling) Um meto¬ 
do de ordena^ao que preserva a ordem da classifi- 
ca^ao das distancias, ou dissimilaridades, originais 
entre as observances. Este metodo geral e robusto 
de ordena^ao pode usar qualquer tipo de medida 
de distancia ou dissimilaridade. [ 12] 
escore do componente principal {principal component 
score) O valor de cada observa^ao, que e uma 
combina^ao linear das variaveis originais medidas 
para aquela observa^ao. E determinado por uma 
analise de componentes principais. [12] 
escores ajustados dos locais (fitted site scores) Um 
resultado da analise de redundancia. Os escores dos 
locais ajustados sao a matriz Z, que resulta de uma 
ordena^ao dos dados originais em rela^ao as carac- 
teristicas ambientais 

escores das especies {species scores) Um resultado 
da analise de redundancia. Os escores das especies 
sao a matriz de autovetores A, que resulta da analise 
de componentes principais da matriz padronizada 
de variancia-covariancia dos valores preditos da 
variavel resposta (Y). E usada para gerar tanto os 
escores dos locais quanto os escores ajustados dos 
locais. [12] 

escores dos locais {site scores) Um resultado da ana¬ 
lise de redundancia. Os escores dos locais sao a ma¬ 
triz F resultante de uma ordena^ao dos dados origi¬ 
nais em rela^ao a caracteristicas ambientais F = YA, 
onde Yea resposta multivariada e A e a matriz de 
autovetores que resulta da analise de componentes 
principais dos valores esperados (ajustados) da 
variavel resposta. Comparar com escores ajustados 
dos locais e escores das especies. [12] 

Z =YA 

onde Y sao os valores preditos da variavel resposta 
multivariada e A e a matriz de autovetores, que 
resulta de uma analise de componentes principais 
dos valores esperados (ajustados) da variavel res¬ 
posta. Comparar com escores dos locais e escores 
das especies. [12] 

escore-Z {Z-score) O resultado de transformar uma 
variavel pela subtra^ao de sua media amostral e divi- 
dindo a diferen^a pelo desvio padrao amostral. [12] 
esfericidade {sphericity) A premissa dos metodos de 
teste de hipoteses multivariado de que as covarian- 
cias de cada grupo sao iguais umas as outras. [12] 
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espaqo amostral ( sample space) O conjunto de todos 
os resultados possiveis ou resultados de um evento 
ou experimento. [ 1 ] 

esquema de pares casados (matched-pairs layout) 

Uma forma de delineamento em blocos aleatoriza- 
dos na qual as replicas sao selecionadas para serem 
similares em tamanho corporal, ou outra caracte- 
ristica, e entao sao atribuidas de maneira aleatoria 
aos tratamentos. [7] 

estatistica assintotica (asymptotic statistics) Esti- 
madores estatisticos que sao calculados com base 
na premissa de que, se o experimento for repetido 
infmitas vezes, o estimador poderia convergir no 
valor calculado. Ver tambem inferencia frequen- 
tista. [3] 

estatistica descritiva (summary statistics) Numeros 
que descrevem a posi^ao e a dispersao de dados. [3] 
estatistica-F (¥-statistic) O resultado, em uma 
analise de variancia (ANOVA) ou em regressao, 
da divisao da soma dos quadrados entre grupos, 
(SQentregrupos) P ela soma dos quadrados dentro de 
grupos (SQ deillrodegrupos ). Ela tern dois graus de liber- 
dade diferentes - os do numerador, associados com 
a SQentregrupos e os g raus de liberdade do denomina- 
dor sao associados com a SQ dentrodegrupos . Esses dois 
valores tambem definem a forma da distribui^ao-F. 
Para determinar sua significance estatistica, ou 
valor de P, a estatistica-F e comparada ao valor cri- 
tico da distribui^ao-F, dado o tamanho amostral, a 
probabilidade de erro Tipo I e os graus de liberdade 
do numerador e do denominador. [5] 
estatistica nao parametrica (non-parametric statistics) 
Um ramo da analise estatistica que nao depende 
dos dados terem sido tirados de uma variavel alea¬ 
toria defmida e com distribui^ao de probabilidade 
conhecida. E frequentemente substituida por anali- 
ses de Monte Carlo. [5] 

estatistica do teste (test statistic) O resultado nu- 
m£rico da manipula^ao de dados que sao usados 
para examinar hipoteses estatisticas. As estatisticas 
do teste sao comparadas a valores que poderiam 
ser obtidas de calculos identicos se a hipotese nula 
estatistica de fato fosse verdadeira. [4] 
estimador destendenciado (unbiased estimator) Um 
parametro estatistico calculado, que nao e consisten- 
temente maior nem menor que o valor real. [3,9] 
estimadores-yw (M-estimators) Um metodo de re¬ 
gressao para minimizar o efeito de dados destoan- 
tes. Eles calculam inclina<;6es de regressoes apos dar 
menos peso as maiores somas dos quadrados. [9] 
estresse (stress) Uma medida de quao bem os resul¬ 
tados de um escalonamento multidimensional nao 


metrico prediz os valores observados. Alem disso, o 
resultado de gastar muito tempo em analises esta¬ 
tisticas e nao tempo suficiente no campo. [12] 
evento (event) Uma simples observa<;ao ou processo 
com comedo e fim claramente defmidos. [ 1 ] 
evento complexo (complex event) Na teoria de con- 
juntos, eventos complexos sao cole^oes de eventos 
simples. Se A e B sao dois eventos independentes, 
entao C = A ou B, expresso como C = A u B e le-se 
“A uniao com B”, sera um evento complexo. Se A e 
B forem eventos independentes, com probabilidades 
associadas P A e P B , entao a probabilidade de C e P c = 
P A + P B . Comparar com eventos compartilhados. [ 1 ] 
eventos compartilhados (complex event) Na teoria 
de conjuntos, os eventos compartilhados sao cole- 
<^oes de eventos simples. Se A e B sao dois eventos 
independentes, entao C- AeB , escrito como C- A 
n B e lido como “A intercessao com B”, e um even¬ 
to compartilhado. Se A e B sao dois eventos inde¬ 
pendentes, cada um associado a uma probabilidade 
P A e P B , entao a probabilidade de C ( P c ) e igual a P A 
x P H . Comparar com evento complexo. [ 1 ] 
exdusivo (exclusive) Um conjunto de resultados e 
dito exclusivo se nao houver nenhuma sobreposi- 
<^ao em seus valores. Comparar com completo. [ 1 ] 
expectativa (expectation) A media aritmetica, media 
ou valor esperado de uma distribui<;ao de probabi¬ 
lidades. [1,2] 

experimento (experiment) Um conjunto de obser¬ 
vances replicadas, em geral realizadas sob condi- 
noes controladas. [ 1 ] 

experimento de pressao (press experiment) Um 
experimento manipulative no qual um tratamento 
e aplicado e reaplicado ao longo da dura^ao do ex¬ 
perimento com objetivo de manter a for^a do trata¬ 
mento. Comparar com experimento de pulso. [6] 
experimento de pulso (pulse experiment) Um ex¬ 
perimento manipulative em que o tratamento e 
aplicado apenas uma vez, e entao a replica “tratada” 
e deixada para se recuperar da manipula<;ao. Com¬ 
parar com experimento de pressao. [6] 
experimento de trajetoria (trajectory experiment) 

Um tipo de experimento natural em que todas as 
replicas sao amostradas repetidamente em muitos 
pontos no tempo. A replicanao e baseada na varia- 
bilidade temporal. Os experimentos de trajetoria 
frequentemente sao analisados usando series tem- 
porais ou modelos autorregressivos. Comparar com 
experimento fotografico. [6] 
experimento fotografico (snapshot experiment) Um 
tipo de experimento natural em que todas as repli¬ 
cas sao amostradas em um ponto no tempo. A re- 
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plica^ao e fundamentada na variabilidade espacial. 
Comparar com experimento de trajetoria. [6] 

experimento manipulative (manipulative experiment) 
Aquele no qual o investigador deliberadamente 
aplica um ou mais tratamentos a uma popula^ao 
amostral, ou populates, e entao observa o resul- 
tado do tratamento. Comparar com experimento 
natural. [6] 

experimento natural (natural experiment) A com¬ 
parand entre dois ou mais grupos que nao foram 
manipulados de nenhuma forma pelo investiga¬ 
dor; pelo contrario, o delineamento recai sobre a 
varia^ao natural entre grupos. Os experimentos 
naturais idealmente comparam grupos que sao 
iguais em todas as formas, exceto para um unico 
fator causal de interesse. Embora os experimen¬ 
tos naturais possam ser analisados com muitas 
das mesmas estatisticas que os manipulativos, as 
inferences resultantes podem ser mais fracas por 
causa de variaveis confundidas que nao foram 
controladas. [1,6] 

extensao (extent) A area espacial total ou amplitu¬ 
de temporal que e coberta por todas as unidades 
amostrais em um estudo experimental. Comparar 
com grd. [6] 

extrapola^ao ( extrapolation ) A estimativa de valores 
nao observados fora da gama dos valores observa- 
dos. Em geral, e menos confiavel que a interpola- 
nd. [9] 


fator (factor) Em delineamentos de ANOVA, um 
conjunto de niveis de um unico tratamento expe¬ 
rimental. [7] 

fator de Bayes (Bayes’ factor) A probabilidade a pos¬ 
teriori em reland da hipotese nula com a alternati- 
va. Se as probabilidades a priori das duas hipoteses 
forem iguais, ele pode ser calculado como a razao 
das verossimilhan^as das duas hipoteses. [9] 
fator de parcela completa (whole plot factor) Em um 
delineamento de parcelas subdivididas, o tratamen¬ 
to que e aplicado a um bloco ou parcela inteira. 
Comparar com fator de subparcela. [7] 
fator de subparcela (Subplot factor) Em um delinea¬ 
mento de parcelas subdivididas, e o tratamento que 
e aplicado dentro de um unico bloco ou parcela. 
Comparar com fator de parcela completa. [7] 
fator entre-sujeitos (between-subjects factor) Na 
ANOVA, o termo que leva em conta a varia^ao en¬ 
tre grupos de tratamentos. Em um delineamento de 
medidas repetidas, o fator entre-sujeitos e equiva- 
lente ao de parcela completa de um delineamento 
de parcelas subdivididas (split-plot design). [7] 


fator intrassujeitos (within-subjectsfactor) Em uma 
ANOVA, e o termo que explica a variance dentro 
dos grupos de tratamentos. Em um delineamento 
de medidas repetidas, o fator intrassujeitos e equi- 
valente ao de subparcelas do delineamento de par¬ 
celas subdivididas. [ 10] 

fatores comuns (common factors) Os parametros 
gerados em uma analise fatorial. Cada variavel ori¬ 
ginal pode ser re-expressa como uma combina^ao 
linear dos fatores comuns, mais um fator adicional 
que e unico aquela variavel. Ver tambem analise fa¬ 
torial e analise de componentes principais. [ 12] 
fatorial (factorial) A operand matematica indicada 
por um ponto de exclama^aoO). Para um dado valor 
de n, o valor do «!, ou “n fatorial”, e calculado como: 

n x (n- 1) x (n-2) x ... x (3) x (2) x (1) 

Portanto, 5! = 5x4x3x2x 1=120. Por defined, 
0! = 1, e fatoriais nao podem ser calculados para 
numeros negativos e que nao sejam inteiros. [2] 

FDC Ver fun^ao de distributed cumulativa. [2 ] 

FDP Ver fun^ao de densidade de probabilidade. [2] 
fechamento (closure) Uma propriedade matemati¬ 
ca dos conjuntos. Os conjuntos sao considerados 
fechados para uma operand matematica em 
particular, por exemplo a adi^ao ou a multiplica¬ 
nd, se o resultado de aplicar uma operand a um 
membro ou a membros do conjunto tambem for 
um membro do conjunto. Por exemplo, o con¬ 
junto de numeros pares {2,4,...} e fechado para 
a multiplicand, pois o produto de dois (ou mais) 
numeros inteiros tambem sera um numero par. 

Em contraste, o conjunto dos numeros naturais 
{0,1,2,...} nao e fechado para a subtra^ao, pois 
e possivel subtrair um numero natural de outro e 
obter um numero negativo (p. ex., 3 - 5 = -2), e 
numeros negativos nao sao numeros naturais. [ 1 ] 
forma quadratica (quadratic form) Uma matriz 1 x 1 
igual ao produto de x 1 Ax, onde x e uma matriz co- 
luna n x 1 e A e uma matriz nx n. [A] 
frequencia (frequency) O numero de observa^oes 
em uma categoria em particular. Os valores do 
eixo-y (ordenada) de um histograma sao frequen¬ 
ces de observances em cada grupo identificadas no 
eixo-x (abscissa). [1] 

frequencia relativa (relative frequency) Ver propor- 
nao.[11] 

fun^ao (function) Uma regra matematica para 
atribuir um valor numerico a outro valor nume- 
rico. Em geral, as funnoes envolvem a aplicanao de 
operates matematicas (como adi^ao ou multipli¬ 
cand) ao valor inicial, para obter o resultado da 
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fun<^ao. As fun^oes muitas vezes sao escritas com 
letras em italico: a fun^ao 

fix) = P 0 + P,x 

significa pegar o x, multiplica-lo por (3, e somar o 
P 0 ao produto. Isto da um novo valor, que e relacio- 
nado ao valor original, x, pela opera<^ao da fun^ao 
fix). [2] 

fun^ao densidade de probabilidade (FDP) (probability 
density function) A fun^ao matematica que atri- 
bui a probabilidade de observar um resultado X t a 
cada valor de uma variavel aleatoria X. [2] 
fun^ao de distribui^ao cumulativa (FDC) (cumulative 
distribution function) A area, acima de um ponto 
X, sob a curva que descreve uma variavel aleatoria. 
Formalmente, se X for uma variavel aleatoria com 
fun^ao de distribui^ao de probabilidade/(X), entao 
a func^ao de distribui^ao cumulativa F(X) e igual a: 

P(x< X)= f* f(x)dx 

J—oo 

A fun^ao de distribui^ao cumulativa e usada para cal- 
cular a probabilidade em cauda de uma hipotese. [2] 
fun^ao de influencia (influence function) Um grafico 
de diagnostico para avaliar o impacto de cada obser- 
va^ao na inclina^ao e no intercepto de um modelo 
de regressao. Neste grafico, os interceptos obtidos 
por jackknife (no eixo-y) sao plotados contra as 
inclina^oes obtidas por jackknife (no eixo-x). A in- 
clina^ao desse grafico sempre deve ser negativa, mas 
dados discrepantes em observances com efeitos in- 
devidos (ou influencia) no modelo de regressao. [9] 
funqao log da verossimilhan^a ( log-likelihood function) 
O logaritmo da fun^ao de verossimilhan^a. Maximi- 
za-la e uma forma de determinar quais parametros 
de uma formula, ou hipotese, melhor explicam os 
dados observados. Ver tambem verossimilhan^a. [8] 
fun^ao monotona continua (continuous monotonic 
function) Uma fun^ao que e definida para todos 
valores em um intervalo e que preserva a ordem 
dos operandos. [8] 


garantia de qualidade e controle de qualidade (GQ/CQ) 

(quality assurance and quality control - QA/QC) 

O processo pelo qual os dados (ou qualquer ativi- 
dade) sao monitorados para determinar que eles 
tern acuracia e precisao. [8] 
grafico de caule-e-folha (stem-and-leaf plot) Um 
histograma “rico em informa^ao” em que o valor 
real de cada dado e ilustrado. [8] 
grafico de dispersao (scatterplot) Um grafico de duas 
dimensoes usado para ilustrar dados bivariados. A 


variavel preditora, ou independente, geralmente e 
colocada no eixo-x e a variavel resposta, ou depen- 
dente, no eixo-y. Cada ponto representa as medi- 
0es dessas duas variaveis em cada observa^ao. [8] 
grafico de residuos (residualplot) Um grafico de 
diagnostico usado para determinar se as premissas 
da regressao ou ANOVA foram cumpridas. Mais 
comumente, os residuos sao plotados contra os 
valores preditos. [9] 

grafico mosaico (mosaicplot) Um grafico destinado 
a ilustra^ao de tabelas de contingencia. O tamanho 
dos retangulos do mosaico e proporcional a fre- 
quencia relativa de cada observac^ao. [11] 
grao (grain) O tamanho espacial ou a extensao tem¬ 
poral da menor unidade amostral em um estudo 
experimental. Comparar com extensao. [6] 
graus de liberdade (gl) (degrees of freedom - df) 
Quantas observa^oes independentes temos para 
uma certa variavel que podem ser utilizadas para 
estimar um parametro estatistico. [3] 
grupo (group) Um conjunto que possui quatro 
propriedades. Primeiro, o conjunto e fechado sob 
alguma opera^ao matematica ® (como adi^ao ou 
multiplicand). Segundo, a operand e associati¬ 
va, de modo que quaisquer tres elementos a, b , c 
do conjunto a ® (b ® c) = (a © b) ® c (onde © 
indica qualquer operand matematica). Terceiro, 
o conjunto tern um elemento identidade I tal que 
para qualquer elemento a do conjunto a © I = a. 
Quarto, o conjunto tern inversos, de maneira que 
para cada elemento a do conjunto existe outro 
elemento b para o qual ab = ba = I. Ver tambem 
fechamento. [ 1 ] 


heterocedastico (heterocedastic) A propriedade de 
um conjunto de dados que diz que a variancia re¬ 
sidual de todos os grupos de tratamentos sao dife- 
rentes. Comparar com homocedastico. [8,9] 
hipotese (hypothesis) Uma afirma^ao testavel de 
causa e efeito. Ver tambem hipotese alternativa e 
hipotese nula. [4] 

hipotese alternativa (alternative hypothesis) A hi¬ 
potese de interesse. Ela e a hipotese estatistica que 
corresponde a questao cientifica que esta sendo 
examinada com os dados. Diferente da hipotese 
nula, a hipotese alternativa diz que “algo esta acon- 
tecendo.” Comparar com hipotese nula e com hipo¬ 
tese estatistica. [4] 

hipotese cientifica (scientific hypothesis) Uma decla- 
ra^ao de causa e efeito. A acuracia de uma hipotese 
cientifica e inferida a partir dos resultados de testar 
hipoteses estatisticas nulas e alternativas. [4] 
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hipotese extrinseca ( extrinsic hypothesis) Um mode- 
lo estatistico em que os parametros sao estimados a 
partir de outras fontes que nao os dados. Comparar 
com hipotese intrinseca. [11] 
hipotese intrinseca ( intrinsic hypothesis) Um mo- 
delo estatistico cujos parametros sao estimados a 
partir dos proprios dados. Comparar com hipotese 
extrinseca. [11] 

hipotese nula ( null hypothesis) A hipotese mais 
simples possivel. Na ecologia e nas ciencias am- 
bientais, a hipotese nula geralmente e que a varia- 
bilidade observada nos dados pode ser atribuida 
inteiramente a aleatoriedade ou a erros de medida. 
Comparar com hipotese alternativa. Ver tambem 
hipotese nula estatistica. [1,4] 
hipotese nula estatistica (statistical null hypothesis) 

A hipotese formal de que nao existe rela^ao mate- 
matica entre duas variaveis, ou a forma estatistica 
da hipotese cientifica de que qualquer variabilidade 
observada nos dados pode ser atribuida inteira¬ 
mente a aleatoriedade ou a erro de medidas. Ver 
tambem hipotese nula. [4] 
histograms (histogram) Um grafico de barras que 
representa a distribuic^ao de frequences. A altura 
de cada barra e igual a frequencia da observa^ao 
identificada no eixo-x. [1,2] 
homocedastico ( homocedastic) A propriedade de 
um conjunto de dados cuja variancia residual de 
todos os tratamentos e igual. Comparar com hete- 
rocedastico. [8] 


IID Representa “independente e identicamente 
distribuido.” Bons delineamentos experimentais 
resultam em replicas e distribui^ao de erros que 
sao IID. Ver tambem ruido branco, independente e 
randomiza^ao. [6] 

impureza ( impurity) Uma medida de incerteza dos 
nos de uma arvore de classifica^ao. [11] 
inclina^ao (slope) A mudan^a no valor esperado de 
uma variavel resposta para uma dada mudan^a na 
variavel preditora. O parametro P, em um modelo 
de regressao. [9] 

indu^ao (induction) O processo de raciocinio cien- 
tifico que progride do especifico (este porco e ama- 
relo) para o geral (todos os porcos sao amarelos). 
Comparar com dedu^ao. [4] 
independente (independent) Dois eventos sao ditos 
independentes se a probabilidade de um ocorrer 
nao esta relacionada de forma alguma a probabili¬ 
dade de ocorrencia do outro. [1,6] 
inferencia (inference) Uma conclusao que, logica- 
mente, surge de observances e premissas. [4] 


inferencia bayesiana (Bayesian inference) Umas das 
tres grandes estruturas de analises estatisticas. Com 
frequencia, e chamada de probabilidade inversa. A 
inferencia bayesiana e usada para estimar a proba¬ 
bilidade de uma hipotese estatistica, de acordo com 
os (ou condicionada pelos) dados disponiveis. O 
resultado de uma inferencia bayesiana e uma nova 
distribui^ao de probabilidades (ou a posteriori). 
Comparar com as analises frequentista, parametri- 
ca e de Monte Carlo. [5] 

inferencia frequentista (frequentist inference) Uma 
abordagem de inferencia estatistica na qual as proba¬ 
bilidades das observances sao estimadas a partir de 
funnCes que assumem um numero infinito de tenta- 
tivas. Comparar com inferencia bayesiana. [1,3] 
interanao (interaction) Os efeitos conjuntos de dois 
ou mais fatores experimentais. Especificamente, a 
interanao representa uma resposta que nao pode ser 
predita apenas conhecendo o efeito principal de cada 
fator, de maneira isolada. As interanCes resultam em 
efeitos nao aditivos. Ela e um importante compo- 
nente dos experimentos multifatoriais. [7,10] 
intercepto (intercept) O ponto em que a linha de 
regressao cruza o eixo-x; ele e o valor esperado de Y 
quando X e igual a zero. [9] 
interpolanao (interpolation) A estimativa de valores 
nao observados dentro da gama de valores obser- 
vados. Em geral, e mais confiavel que a extrapola- 
nao.[9] 

intersenao (intersection) Na teoria de conjuntos, 
os elementos que sao comuns a dois ou mais con¬ 
juntos. Na teoria de probabilidades, a de que dois 
eventos ocorram ao mesmo tempo. Em ambos os 
casos, a intersenao e escrita com o simbolo n. Com¬ 
parar com uniao. [1] 

intervalo (interval) Um conjunto de numeros com 
um minimo e um maxi mo definidos. [2] 
intervalo aberto (open interval) Um intervalo que 
nao inclui seus extremos. Desta forma, o intervalo 
(0,1) e o conjunto de todos os numeros entre 0 e 
1, com excenao de 0 e 1 . Comparar com intervalo 
fechado. [2] 

intervalo de confianna (confidence interval) O inter¬ 
valo que inclui a verdadeira media da populanao n% 
das vezes. O termo intervalo de confianna sempre 
deve ser classificado em «%, como em intervalo de 
confianna de 95%, intervalo de confianna de 50%, 
etc. Os intervalos de confianna sao calculados usando 
estatistica frequentista. Comumente sao mal inter- 
pretados como representando uma chance de n% de 
que a media esteja dentro do intervalo de confianna. 
Comparar com intervalo de credibilidade. [3] 
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intervalo de credibilidade ( credibility interval) Um 
intervalo que representa n% de chances de que a 
media da popula^ao esteja neste intervalo. Como 
no intervalo de confian^a, o de credibilidade sem- 
pre deve ser classificado: intervalo de credibilidade 
de 95%, intervalo de credibilidade de 50%, etc. 
Esses intervalos sao determinados conforme a 
estatistica bayesiana. Comparar com intervalo de 
confian<^a. [3,5] 

intervalo fechado ( closed interval) Um intervalo que 
inclui seus pontos finais. Assim, o intervalo fechado 
[0,1] e o conjunto de todos os numeros entre 0 e 1, 
incluindo 0 e 1 . Comparar com intervalo aberto. [2] 
intervalo de predi^ao inversa (inverseprediction inter¬ 
val) Fundamentado em um modelo de regressao, 
e a amplitude de valores possiveis do X (ou predi- 
tor) para um dado valor do Y (ou resposta). [9] 
intervalo de predi^ao simultanea (simultaneous predic¬ 
tion interval) Um ajuste em um intervalo de con- 
fian^a de analise de regressao que e necessario caso 
seja feita uma estimativa de multiplos valores. [9] 


jackknife (jackknife) Uma ferramenta para varios 
propositos. Na estatistica, o jackknife e um proces- 
so de aleatoriza<;ao (ou Monte Carlo) no qual uma 
observa^ao e excluida do conjunto de dados, e a 
estatistica e entao recalculada. Isto e repetido tantas 
vezes quanto ha de observa^oes. A estatistica teste, 
calculada a partir dos dados originais, e comparada 
com a distribui<;ao da estatistica teste obtida pela 
repetida aplica^ao do jackknife, fornecendo um 
valor de P exato. Ver tambem bootstrap e fun<^ao de 
influencia. [5,12] 


Lei dos Grande Numeros (Law of Large Numbers) 

Um teorema fundamental da probabilidade, a 
Lei dos Grandes Numeros diz que quanto maior 
a amostra, mais proxima a media aritmetica se 
torna a expectativa probabilistica de uma dada 
variavel. [3] 

Leptocurtica (leptokurtic) Uma distribui^ao de 
probabilidades e dita leptocurtica se ela tiver relati- 
vamente poucos valores no centro da distribui^ao 
e caudas pouco pesadas. A curtose de uma distri- 
bui<^ao leptocurtica e maior que 0. Comparar com 
platicurtica. [3] 


MANOVA Ver analise de variancia multivariada. [ 12] 
matriz (matrix) Um objeto matematico (frequen- 
temente usado como variavel) constituido por 
muitas observa^oes (linhas) e muitas variaveis 
(colunas). [12] 


matriz de classifica^ao (classification matrix) Um re- 
sultado de uma analise discriminante. Uma tabela 
onde as linhas representam os grupos observados 
a que cada observa^ao pertence e as colunas repre¬ 
sentam a predi<;ao do grupo a que cada observa^ao 
pertence. Os valores nesta tabela representam o 
numero de observances colocadas em cada par 
(observado, predito). Em uma classificanao perfeita 
(uma analise discriminante sem nenhum erro), 
somente os elementos da diagonal da matriz de 
classificanao terao valores diferentes de zero. [12] 
matriz de colunas ortonormais (column-orthonormal 
matrix) Uma matriz mxn cujas colunas foram 
normalizadas de maneira que a distancia euclidiana 
de cada coluna = 1. [A] 

matriz de grafico de dispersao (scatterplot matrix) 

Um grafico feito com varios graficos de dispersao 
e usado para ilustrar dados multivariados. Cada 
grafico e de dispersao simples e eles sao agrupados 
por linhas (com variaveis Y em comum) e por 
colunas (com variaveis X em comum). O arranjo 
desses graficos em uma matriz ilustra todas as re¬ 
lates bivariadas possiveis entre todas as variaveis 
medidas. [8] 

matriz de variancia e covariancia (variance-covariance 
matrix) Uma matriz quadrada C (n linhas x n 
colunas,onde neo numero de medidas ou obser¬ 
vances individual para cada observa^ao multiva¬ 
riada) em que os elementos da diagonal c-• sao as 
variancias de cada variavel e os elementos fora da 
diagonal c t . sao as covariancias entre a variavel i e 
a;. [9,12] 

matriz diagonal (diagonal matrix) Uma matriz qua¬ 
drada em que todos os valores, exceto os da diago¬ 
nal principal, sao iguais a zero. [ 12] 
matriz identidade (identity matrix) Uma matriz dia¬ 
gonal em que todos os termos da diagonal sao = 1 e 
todos os outros = 0. [A] 

matriz inversa (inverse matrix) Uma matriz A 1 tal 
que AA 1 = I, a matriz identidade. [A] 
matriz quadrada (squared matrix) Uma matriz com 
o mesmo numero de linhas e de colunas. [12] 
matriz triangular (triangular matrix) Uma matriz na 
qual todos os valores em um dos lados da diagonal 
sao = 0. [A] 

matriz triangular inferior (lower triangular matrix) 
Uma matriz na qual todos os elementos acima da 
diagonal sao = 0. [A] 

matriz triangular superior (upper triangular matrix) 
Uma matriz na qual todos os elementos abaixo da 
diagonal = 0. [A] 
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maxima verossimilhan^a ( maximum likelihood) O 
valor mais provavel da distribui^ao de verossimi- 
lhan^as e calculado pegando a derivada da veros- 
similhan^a e determinando quando a derivada e 
igual a 0. Para muitos metodos estatisticos parame- 
tricos ou frequentistas, a estatistica teste assintotica 
e o valor de maxima verossimilhan^a daquela 
estatistica. [5] 

media ( avearage - mean) Em ingles, existem duas 
palavras que podem ser traduzidas como media, 
average e mean. Portanto, a media pode ter 2 signi- 
ficados: 1) no contexto de average , indica a media 
aritmetica de uma variavel. Com frequencia e usa- 
da de maneira incorreta para indicar o valor mais 
comum de uma variavel. Comparar com moda, me¬ 
dians e com o segundo significado de media. 2) no 
contexto de mean, e o valor mais provavel de uma 
variavel aleatoria ou de um conjunto de observa¬ 
nces. A media deve ser classificada em: aritmetica, 
geometrica ou harmonica. Se nao for classificada, 
assume-se que e a media aritmetica. Comparar com 
moda e mediana. [3] 

media ajustada ( adjusted mean) O valor esperado 
de um grupo tratamento caso todos os grupos te- 
nham a mesma covariavel media. [10] 
media aritmetica ( arithmetic mean) A media de um 
conjunto de observances de uma dada variavel. Ela 
e calculada como a soma de todas as observances 
dividida pelo numero de observances, e e simbo- 
lizada por uma barra horizontal sobre o nome da 
variavel, por exemplo, Y. [3] 
media geometrica ( geometric mean) A M-esima raiz 
do produto de n observances. Uma media util da 
expectativa para variaveis log-normal. A media 
geometrica e sempre menor que ou igual a media 
aritmetica. [3] 

media harmonica ( harmonic mean) E o inverso da 
media aritmetica dos inversos das observances. A 
media harmonica e uma estatistica util para calcu- 
lar o tamanho efetivo da populanao (o tamanho de 
uma populanao com acasalamentos completamente 
aleatorios). A media harmonica sempre e menor 
que ou igual a media geometrica. [3] 
mediana (median) O valor de um conjunto de ob¬ 
servances que esta exatamente no centro de todos os 
valores: metade dos valores sao menores e metade 
sao maiores. O cento do quinto decil, ou o 50-esimo 
percentil. Comparar com media e moda. [3] 
metadados ( metadata) Dados sobre dados. A prosa 
descritiva que descreve todas as variaveis e caracte- 
risticas de um conjunto de dados. [8] 


metodo de Bonferroni (Bonferroni method) Um ajus- 
te do valor critico, a, ao qual a hipotese nula sera 
rejeitada. Ele e usado quando sao feitas observances 
multiplas, e e calculado como o a (geralmente igual 
a 0,05) dividido pelo numero de comparanCes. 
Comparar com o metodo de Dunn-Sidak. [10] 
metodo de Dunn-Sidak ( Dunn-Sidak method) Um 
ajuste do valor critico, a, no qual a hipotese nula 
sera rejeitada. E usado quando multiplas compara¬ 
nCes sao feitas e e calculado como a ajustado e igual a 

1 - d - “nominal) 0nde “nominal * ° Val ° r CrftfcO do 

a (geralmente 0,05) ekeo numero de compara¬ 
nCes. Comparar com o metodo de Bonferroni. [10] 
metodo hipotetico-dedutivo ( hypothetico-deductive 
method) O metodo cientifico creditado a Karl 
Popper. Como na indunao, o metodo hipoteti¬ 
co-dedutivo se inicia com uma observanao indi¬ 
vidual. A observanao pode ser predita por muitas 
hipoteses, cada uma das quais fornece predinCes 
adicionais. As predinCes sao testadas uma a uma 
e as hipoteses alternativas vao sendo eliminadas 
ate que reste apenas uma. Os praticantes do me¬ 
todo hipotetico-dedutivo nunca confirmam uma 
hipotese; eles apenas as rejeitam, ou falham em 
rejeita-las. Quando os livros-texto se referem “ao 
metodo cientifico”, geralmente estao se referindo ao 
metodo hipotetico dedutivo. Comparar com indu¬ 
nao, dedunao e inferencia bayesiana. [4] 
metodos de Monte Carlo (Monte Carlo methods) Me¬ 
todos estatisticos que recaem sobre a aleatorizanao 
ou o remanejamento dos dados, com frequencia 
usando metodos de bootstrap ou de jackknife. O 
resultado de uma analise de Monte Carlo e um 
valor exato de probabilidade para os dados, dada a 
hipotese nula estatistica. [5] 
metrica (metric) Um tipo de medida de distancia 
(ou dissimilaridade) que satisfaz quatro proprie- 
dades: (1) a distancia minima e igual a 0 e a entre 
objetos identicos e igual a 0; (2) a distancia entre 
dois objetos nao identicos e positiva; (3) as distan¬ 
ces sao simetricas: a do objeto a para o be igual 
a distancia do objeto b para o objeto a ; e (4) as 
medidas das distancias satisfazem a desigualdade 
dos triangulos. Comparar com semimetrica e nao 
metrica. [12] 

minimos quadrados aparados (least-trimmed squares) 
Um metodo de regressao para minimizar o efeito 
de dados discrepantes. Calcula a inclinanao da 
regressao apos remover alguma propornao (espe- 
cificada pelo analista) das maiores somas dos qua¬ 
drados dos residuos. [9] 
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moda {mode) O valor mais comum em um conjun- 
to de observances. Coloquialmente, a media (ou 
media da popula^ao) em geral e confundida com a 
moda. Comparar com media e mediana. [3] 
modelo {model) Uma fun^ao matematica que rela- 
ciona um conjunto de variaveis a outro por meio 
de um conjunto de parametros. Todos os modelos 
sao errados, mas alguns sao uteis. [11] 
modelo de regressao linear {linear regression model) 
Um modelo estatistico no qual a relanao entre o 
preditor e a variavel resposta pode ser ilustrada por 
uma linha reta. Um modelo e dito linear porque 
seus parametros sao constantes e afetam a variavel 
preditora apenas aditiva ou multiplicativamente. 
Comparar com modelo de regressao nao linear. [9] 
modelo de regressao nao linear {non-linear regression 
model) Um modelo estatistico no qual a rela^ao 
entre as variaveis preditora e resposta nao e uma li¬ 
nha reta e que as variaveis preditoras afetam a varia¬ 
vel resposta de forma nao aditiva ou nao multiplica- 
tiva. Comparar com modelo de regressao linear. [9] 
modelo de serie temporal {time series model) Um 
modelo estatistico em que o tempo e incluido de 
manera explicita, como uma variavel preditora. 
Muitos modelos de series temporais tambem sao 
modelos autorregressivos. [6] 
modelo fatorial {factor model) O resultado de uma 
analise fatorial apos os fatores comuns de suas 
cargas correspondentes terem sido padronizadas 
e da reten^ao apenas dos fatores comuns uteis (ou 
significativos). [12] 

modelo log-linear {log-linear model) Um modelo 
estatistico em que o logaritmo dos parametros e 
linear. Por exemplo, o modelo Y = aX 1 ’ e um mo¬ 
delo log-linear, pois o logaritmo transforma os 
resultados em um modelo linear: log(T) = log(a) + 
b x log(X). [11] 

modelo misto {mixed model) Um modelo de ANOVA 
que inclui tan to efeitos aleatorios quanto fixos. [ 10] 
modelos hierarquicos {hierarchical models) Um gru- 
po de modelos estatisticos em que os parametros 
dos modelos mais simples sao um subconjunto de 
parametros de modelos mais complexos. [11] 
momento central {central moment) A media (arit- 
metica) das diferen^as entre cada observa^ao de 
uma variavel e a media aritmetica daquela variavel, 
elevada a r-esima potencia. O termo de momento 
central precisa sempre ser classificado: p. ex., pri- 
meiro momento central, segundo momento cen¬ 
tral, etc. O primeiro momento central e igual a 0 e 
o segundo momento central e a variancia. [3] 


mudan^a de escala {change of scale) A transforma- 
<^ao de uma variavel aleatoria normal realizada 
multiplicando-a por uma constante. Ver tambem 
opera^ao de deslocamento. [2] 
multicolinearidade {multicollinearity) As correla¬ 
tes indesejadas entre duas ou mais variaveis pre¬ 
ditoras. Ver tambem colinearidade. [7,9] 
multinormal {multinormal) Abrevia^ao para normal 
multivariada. [12] 


nao metrica {non-metric) Um tipo de medida de 
distancia (ou dissimilaridade) que satisfaz duas 
propriedades; (1) A distancia minima e igual a 0 e a 
entre objetos identicos e igual a 0; (2) as distancias 
sao simetricas - ou seja, a distancia do objeto a 
para obea mesma do objeto b para o a. Comparar 
com metrica e semimetrica. [12] 
nivel {level) O valor individual de um dado trata- 
mento ou fator experimental em uma analise de 
variancia ou em um delineamento tabular. [7,11] 
NMDS Ver escalonamento multidimensional nao 
metrico. [12] 


ordena^ao {ordination) Metodos de redu^ao de 
dados multivariados atraves do arranjo das obser- 
va<;6es ao longo de um numero de eixos menor que 
o de variaveis. [12] 

ordenada {ordinate) A vertical, ou eixo-y, de um 
grafico. O oposto da abscissa. [7] 

operaqao de deslocamento {shift operation) A trans- 
forma^ao de uma variavel aleatoria normal atraves 
da adi^ao de uma constante. Ver tambem mudan<^a 
de escala. [2] 

ortogonal {orthogonal) Em uma analise de varian¬ 
cia (ANOVA) multifatorial, e a propriedade de 
que todas as combinat^s dos tratamentos sejam 
representadas. Em um delineamento de regressao 
multipla, e a propriedade de que todos os valores 
de uma variavel preditora sejam encontrados em 
combina^ao com cada valor de outra variavel pre¬ 
ditora. [7,9] 

ortogonal 2 {orthogonal) Em algebra de matrizes, 
dois vetores cujo produto = 0 sao ditos ortogo- 
nais. [A] 

ortonormal {orthonormal) Uma transforma^ao 
aplicada a uma matriz de forma que as distancias 
euclidianas das linhas, colunas ou ambas sejam 
igual a 1. [12] 


paradigma {paradigm) Uma estrutura de pesquisa 
sob a qual existe uma concordance geral. Thomas 
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Kuhn usou o termo “paradigma” ao descrever cien- 
cia “ordinaria”, que e a atividade de cientistas en- 
gajados em ajustar as observances aos paradigmas. 
Quando muitas observances nao se ajustam, e hora 
de um novo paradigma. Kuhn chamou as mudan- 
nas de paradigmas de revolu^oes cientificas. [4] 
parametrico ( parametric) O pressuposto de que 
quantidades estatisticas podem ser estimadas usan- 
do distributes de probabilidades com constantes 
definidas e fixas. O requisito de que varios testes 
estatisticos conformem uma distribui^ao de proba¬ 
bilidades conhecida e defimvel. [3] 
parametro (parameter) Uma constante em distri¬ 
butes e equa^oes estatisticas que precisam ser 
estimadas a partir dos dados. [3,4] 
parametros parciais da regressao (partial regression 
parameters) Os parametros em um modelo de re¬ 
gressao multipla cujos valores refletem a contribui- 
nao de todos os outros parametros no modelo. [9] 
PC A Ver analise de componentes principals. [12] 
percentil (percentile) A centesima parte de algo. Em 
geral e classificado como quinto percentil (um vi- 
gesimo), decimo percentil (decil), etc. [3] 
permuta^ao (permutation) O arranjo de objetos 
discretos. Diferente de combinanao, a permutanao e 
qualquer rearranjo de objetos. Assim, para o conjunto 
{1,2,3}, ha seis permuta^oes possiveis: {1,2,3}, {1,3,2}, 
{2,1,3}, {2,3,1}, {3,2,1}, {3,1,2}. Contudo, tudo isso re- 
presenta a mesma combinanao dos tres objetos 1,2,3. 
Existem n\ permuta^oes de n objetos, mas apenas 

n\ 

X\(n — X)\ 

combinanoes de n objetos tirados X por vez. O sim- 
bolo “!” e o operador matematico para fatorial. Ver 
tambem coeficiente binomial, combinanao. [2] 
planilha eletronica (spreadsheet) Um arquivo de 
computador em que cada linha representa uma 
unica observanao e cada coluna, uma unica variavel 
medida ou observada. A forma padrao na qual 
os dados ecologicos ambientais sao colocados em 
meios eletronicos. Ver tambem arquivo simples. [8] 
platicurtica (platikurtic) Uma distribuinao de 
probabilidades e dita platicurtica se ela tiver relati- 
vamente muitos valores no centro da distribuinao 
e caudas relativamente finas. A curtose de uma dis¬ 
tribuinao platicurtica e maior que 0. Comparar com 
leptocurtica. [3] 

plot (plot) Uma ilustra^ao de uma variavel ou um 
conjunto de dados. Tecnicamente, plots sao elemen- 
tos de graficos. [8] 


poder (power) A probabilidade de corretamente 
rejeitar uma hipotese nula estatistica falsa. £ cal- 
culado como 1 - (}, onde (i e a probabilidade de 
cometer um erro Tipo II. [4] 
porcentagem (percentage) Literalmente, “de 100” 

(do Latim per centum) y a frequencia relativa de um 
conjunto de observances multiplicada por 100. As 
porcentagens podem ser calculadas a partir de uma 
tabela de contingencia, mas a analise estatistica 
desta tabela sempre e baseada nas contagens de fre¬ 
quencia relativa. [11] 

pos-multiplicanao e pos-produto (postmultiplication 
and postproduct) Em algebra de matrizes, e o pro- 
duto BA de duas matrizes quadradas A e B. [A] 
posinao (location) O local em uma distribuinao de 
probabilidades onde a maioria das observanoes 
pode ser encontrada. Comparar com dispersao. [3] 
pre-multiplicaqao e pre-produto (premultiplication 
and preproduct) Em algebra de matrizes, e o pro- 
duto AB de duas matrizes quadradas A e B. [A] 
precisao (precision) O nivel de concordancia entre 
um conjunto de medidas sobre o mesmo individuo. 
Tambem e usada na inferencia bayesiana para indi¬ 
car a quantidade igual a 1/variancia. Comparar com 
acuracia. [2, 5] 

primeiro eixo principal (firstprincipal axis) A nova 
variavel, ou eixo, que resulta de uma analise de 
componentes principals e explica mais variabilida- 
de nos dados que qualquer outro eixo. Tambem e 
chamado de primeiro componente principal. [12] 
probabilidade (probability) A propornao de resulta- 
dos em particular obtidos a partir de um dado nu- 
mero de tentativas, ou a propornao esperada para 
um numero infmito de tentativas. [1] 
probabilidade a posteriori (posterior probability) A 
probabilidade de uma hipotese, conforme os 
resultados de um experimento e qualquer conhe- 
cimento previo. O resultado do Teorema de Bayes. 
Comparar com probabilidade a priori. [ 1 ] 
probabilidade a priori (prior probability) A probabi¬ 
lidade de uma hipotese antes de um experimento 
ser conduzido. Isso pode ser determinado pela ex- 
periencia previa, intuinao, opiniao de especialistas 
ou revisao da literatura. Comparar com probabili¬ 
dade a posteriori. [1] 

probabilidade combinada de Fisher (Fisher's combi¬ 
ned probability) Metodo para determinar se os 
resultados de multiplas comparanoes sao signifi- 
cantes, sem recorrer ao ajuste de taxa de erro por 
experimento. Ela e calculada como a soma dos 
logaritmos de todos os valores de P multiplicada 
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por -2. Esse teste estatistico e distribuido como 
uma variavel aleatoria de chi-quadrado com graus 
de liberdade igual a 2 vezes o numero de compa- 
ra^oes. [ 10) 

probabilidadecondicional (conditional probability) 

A probabilidade de um evento compartilhado 
quando os eventos simples associados nao sao 
independentes. Se o evento B ja aconteceu e a 
probabilidade de observar o evento A depende do 
resultado de B, entao dizemos que a probabilidade 
de A e conditional a B. Representamos isso como 
P( A | B), e a calculamos como: 


PM | B) = 


P(AnB) 

P(B) 


m 


probabilidade de cauda (tail probability ) A proba¬ 
bilidade de obter nao apenas os dados observados, 
mas tambem possiveis dados mais extremos, mas 
que nao foram observados. Tambem chamada de 
valor de P (valor de probabilidade) e calculada 
usando a fun^ao de distribui^ao cumulativa. Ver 
tambem valor de probabilidade. [2,5] 
probabilidade exata (exact probability) A proba¬ 
bilidade de obter somente o resultado observado. 
Comparar com probabilidade de cauda. [2,5] 
processos de Markov (Markovprocess) Uma sequen- 
cia de eventos cuja probabilidade de um evento 
ocorrer depende somente da ocorrencia de outro 
evento imediatamente predecessor. [3) 
produto escalar (scalar product) Em algebra de 
matrizes, e o produto de um vetor linha 1 x 11 e um 
vetorcoluna fix 1. [A] 

propor^ao ( proportion ) Frequencia relativa. O nu¬ 
mero de observa^des de uma determinada catego- 
ria, dividido pelo numero total de observances. As 
propor^oes podem ser calculadas a partir de tabelas 
de contingencia, mas a analise estatistica dessa ta- 
bela e sempre baseada na frequencia de contagem 
original. (11) 

propor^ao de variancia explicada (PVE) (proportion 
of variance explained - PEV) A quantidade de 
variabilidade nos dados explicada por cada fator da 
analise de variancia. E equivalente ao coeficiente de 
determinant do modelo de regressao. [10] 

PVE Ver propor^ao de variancia explicada. [10] 


quadrado latino (latin square) Um delineamento 
de blocos aleatorizados no qual n tratamentos sao 
definidos em um quadrado n x n e que cada trata- 
mento aparece exatamente uma vez em cada linha e 
em cada coluna do campo. [7] 


quadrado medio (mean square) A media das diferenn^as 
entre o valor de cada observant e a media aritmetica 
dos valores, elevadas ao quadrado. Tambem e chama- 
do de variancia, ou segundo momento central. [3] 

quantil (quantile) A w-esima parte de algo. Tipos 
especificos de quantis incluem os decis, percentis e 
quartis. [3] 

quartil ( quartile ) Um quarto de algo. Os quartis, 
superior e inferior, de um conjunto de dados sao os 
25% do fundo e os 25% do topo dos dados. [3) 

r 2 ajustado (adjusted r‘) Quao bem um modelo de 
regressao se ajusta aos dados, descontando o nume¬ 
ro de parametros no modelo. £ usado para evitar o 
superajuste de um modelo simplesmente incluindo 
variaveis preditoras adicionais. Ver tambem coefi¬ 
ciente de determina^ao. [ 9) 

randomizacao (randomization) A atribui^ao de tra¬ 
tamentos exp»erimentais a populates com base em 
tabelas de numeros, ou algoritmos, randomicos. 
Comparar com casual. [6) 

rastro de auditoria (audit trail ) O conjunto de ar- 
quivos e documentos associados que descrevem 
mudan^as em um conjunto original de dados. Ela 
descreve todas as mudan^as feitas no arquivo de 
dados original que resultaram no conjunto de da¬ 
dos tratado usado nas analises. [8) 
razao de chances a posteriori (posterior odds ra¬ 
tio) Em uma analise bayesiana, a razao da dis- 
tribui^ao de probabilidades a posteriori de duas 
hipoteses altemativas. [9] 

razao de chances a priori (prior odds ratio) A razao 
da distribui^ao de probabilidades a priori de duas 
hipoteses altemativas. [9] 

razao de Poisson (rateparameter) A constante que 
e inserida na formula de uma variavel aleatoria de 
Poisson. Alem disso, a media, ou valor esperado, e a 
variancia de uma variavel aleatoria de Poisson. [2] 
razao-F de Fisher (Fisher 's F-ratio) A estatistica-F 
usada na analise de variancia. [5] 

RDA Ver analise de redundancia. [ 12) 

Regra dos 10 (Rule of 10) Um principio-guia diz que 
voce deveria ter no minimo 10 replicas por catego- 
ria observacional ou grupo de tratamento. A regra 
baseia-se na experiencia, e nao em algum axioma 
ou teorema matematico. [6) 

regressao (regression) O metodo de analise usado 
para explorar relates de causa e efeito entre duas 
variaveis, cuja variavel preditora e continua. Com- 
parar com correla^ao. [7,9] 
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regressao gradativa ( stepwise regression) Qualquer 
tipo de procedimento de regressao que envolve 
avaliar multiplos modelos com parametros com- 
partilhados. O objetivo e decidir quais parametros 
sao uteis ao modelo de regressao final. Os exemplos 
de metodos usados na regressao gradativa incluem 
elimina^ao regressiva e sele<^ao progressiva. [9] 
regressao logistica ( logistic regression) Um modelo 
estatistico para estimar variaveis resposta categori- 
cas a partir de uma variavel preditora continua. [9] 
regressao multipla ( multiple regression) Um modelo 
estatistico que prediz uma resposta a partir de mais 
de uma variavel preditora. Pode ser linear ou nao 
linear. [9] 

regressao quantilica ( quantile regression) Um mode¬ 
lo de regressao sobre um subconjunto (um quantil 
definido pelo analista) dos dados. [9] 
regressao robusta ( robust regression) Um modelo 
de regressao que e relativamente pouco sensivel a 
dados discrepantes ou valores extremos. Exemplos 
incluem a regressao de mmimos quadrados apara- 
dos e os estimadores-M. [9] 
reifica^ao ( reification) Conversao de um conceito 
abstrato em um objeto material. [8] 
replica ( replicate) Uma observa^ao ou tentativa 
individual. A maioria dos experimentos possui 
replicas multiplas de cada categoria ou grupo de 
tratamento. [1, 7] 

replicaqao ( replication) O estabelecimento de multi¬ 
plas parcelas, observa^oes ou grupos dentro do mes- 
mo experimento ou tratamento observacional. Ideal- 
mente, a replica^ao e obtida pela aleatoriza^ao. [6] 
residuo ( residual ) A diferen^a entre um valor obser- 
vado e seu valor previsto por um modelo estatisti¬ 
co. [8,9] 

residuos normalizados (studentized residuals) Ver 
residuos padronizados. [9] 
residuos padronizados ( standardized residuals) Um 
residuo transformado em um escore-Z. [9] 
resultado ( outcome) Do ingles outcome , e o resulta- 
do, geralmente de uma observa^ao ou tentativa. [ 1 ] 
resultado discreto ( discrete outcome) Um resultado 
ou observa^ao que pode assumir valores indepen- 
dentes ou inteiros. [1] 

rotaqao ( rotation) Em uma analise fatorial, rota^ao 
e uma combina^ao linear de fatores comuns que 
sao facilmente interpretados. Ver rota^ao obliqua, 
rota^ao ortogonal e rota^ao varimax. [12] 
rota^ao obliqua ( oblique rotation) Uma combina^ao 
linear dos fatores comuns em uma analise fatorial 
que resulta em fatores comuns que podem ser 


correlacionados uns com os outros. Comparar com 
rota^ao ortogonal e rota^ao varimax. [12] 
rota^ao ortogonal ( orthogonal rotation) A combina- 
<;ao linear dos novos fatores comuns de uma analise 
fatorial que resulta em fatores comuns que nao tern 
correla<;ao uns com os outros. Comparar com rota- 
<^ao obliqua e rota^ao varimax. [12] 
rota^ao varimax ( varimax rotation) Combina^ao li¬ 
near dos fatores comuns em uma analise fatorial que 
minimiza a variancia total dos fatores comuns. Com¬ 
parar com rota^ao obliqua e rota^ao ortogonal. [12] 
ruido branco ( white noise) Uma distribui^ao de erro 
em que os erros sao independentes e nao correla¬ 
cionados (ver IID). E chamado de ruido branco 
por analogia com a luz: como a luz branca e uma 
mistura de todos os comprimentos de onda, o rui¬ 
do branco e uma mistura de todas as distributes 
de erro. [6] 


scree plot (scree plot) Um grafico de diagnostico usa- 
do para decidir quantos componentes, fatores ou 
eixos sao necessarios reter em uma ordena^ao. Ele 
tern formato de encosta de montanha (ou declive 
de pedreira); os componentes uteis sao os mais al¬ 
tos na encosta e os sem utilidade sao os escombros, 
embaixo. [3] 

sele^ao progressiva (forward selection) Um metodo 
de regressao gradativa (stepwise regression) que 
come^a com um modelo que possui apenas um 
dentre varios parametros possiveis. Os parametros 
adicionais sao testados e inseridos sequencialmente 
um de cada vez. Ver tambem regressao gradativa e 
comparar com elimina^ao regressiva. [9] 

semimetrica (semi-metric) Um tipo de medida de 
distancia (ou similaridade) que satisfaz tres pro- 
priedades: (1) a distancia minima e igual a 0 e a 
entre objetos identicos e igual a 0; (2) a distancia 
entre dois objetos nao identicos e positiva; (3) as 
distancias sao simetricas - ou seja, a do objeto a 
ate um objeto be a mesma que do objeto b ate o a. 
Comparar com metrica e nao metrica. [12] 

silogismo (syllogism) Uma dedu^ao, ou conclusao, 
logica (p. ex., este e um porco) e derivada de duas 
premissas (p. ex., 1, todos os porcos sao amarelos; 

2, este objeto e amarelo). Os silogismos foram pri- 
meiramente descritos por Aristoteles. Embora se- 
jam logicos, eles podem levar a conclusoes erroneas 
(p. ex., e se o objeto amarelo na verdade for uma 
banana?). [4] 

simetrico (symmetric) Um objeto cujos lados sao 
imagens-espelho uma da outra. Uma matriz e dita 
simetrica se um espelho for alinhado ao longo de 
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sua diagonal; os valores (linha, coluna) acima da 
diagonal devem ser iguais aos valores (coluna, li¬ 
nha) abaixo da diagonal. [2,12] 
soma dos produtos cruzados (SPC) ( sum of cross pro¬ 
ducts - SCP) A soma do produto da diferen^a 
entre cada observa^ao e seu valor esperado. A soma 
dos produtos cruzados dividida pelo tamanho 
amostral e a covariancia. [9] 
soma dos quadrados (SQ) ( sum of squares - SS) A 
soma das diferen^as ao quadrado entre o valor 
de cada observa^ao e a media aritmetica de todos 
os valores. Usada extensivamente em calculos da 
ANOVA. [3] 

soma dos quadrados dos residuos (residual sum of 
squares) O que e deixado (nao e explicado) por 
um modelo de regressao ou ANOVA. E calculado 
como a soma dos desvios quadrados de cada ob- 
serva^ao ate a media de todas as observances em 
seus grupos de tratamento, entao essas somas sao 
calculadas sobre todos os grupos de tratamento. 
Tambem chamada de varia^ao do erro ou varia^ao 
residual. [9, 10] 

soma dos quadrados e produtos cruzados (SQPC) (sum 
of squares and cross products - SSCP) Uma matriz 
quadrada com o numero de linha e numero de co- 
lunas igual ao de variaveis em um conjunto de da¬ 
dos multivariado. Os elementos da diagonal dessa 
matriz sao a soma dos quadrados de cada variavel e 
os elementos fora da diagonal sao a soma dos pro¬ 
dutos cruzados de cada par de variaveis. As matri- 
zes SQPC sao usadas para calcular estatisticas-teste 
na MANOVA. [12] 

SQPC Ver soma dos quadrados e dos produtos cru¬ 
zados. [12] 

subconjunto (subset) Uma cole^ao de objetos que 
tambem e parte de um grupo, ou conjunto, maior 
de objetos. Ver tambem , conjunto. [1] 


tabela de contingency (contingency table) Uma 
forma de organizar, mostrar e analisar dados para 
ilustrar relates entre duas ou mais variaveis cate- 
goricas. Os valores em uma tabela de contingencia 
sao as frequences (contagens) de observa^oes em 
cada categoria. [11] 

tamanho do efeito (effect size) A diferen^a esperada 
entre as medias de grupos que estao sujeitos a dife- 
rentes tratamentos. [6] 

taxa de erro por experimento (experiment-wide error 
rate) O valor critico verdadeiro do a para o 
ponto em que a hipotese nula sera rejeitada, apos 
a corre^ao de compara^oes multiplas. Pode ser 


obtido usando os metodos de Bonferroni ou de 
Dunn-Sidak, dentre outros. [ 10] 
tentativa (trial) Uma replica ou observa^ao visual. 
Muitas tentativas formam um experimento estatis- 
tico. [ 1 ] 

tentativa de Bernoulli (Bernoulli trial) Um experi¬ 
mento que tern apenas dois resultados possiveis, 
como presen^a/ausencia; vivo/morto; cara/coroa. 
Uma tentativa de Bernoulli resulta em uma variavel 
aleatoria de Bernoulli. [2] 

Teorema de Bayes (Bayes 7 Theorem) A formula para 
calcular a probabilidade de uma hipotese de inte- 
resse, conforme os dados observados e qualquer 
conhecimento previo acerca da hipotese: 

/o-imro) 

I p (r) 

Teorema do Limite Central (Central Limit Theorem) O 
resultado matematico que permite o uso de estatis- 
tica parametrica sobre dados que nao tern distribui- 
<;ao normal. O Teorema do Limite Central mostra 
que qualquer variavel aleatoria pode ser transforma- 
da em uma variavel aleatoria normal. [2] 
teoria (theory) Na ciencia, uma teoria e uma cole^ao 
de conhecimentos aceitos que foram construidos 
atraves de repetidas observa^oes e testes estatisticos 
de hipoteses. As teorias formam as bases dos para- 
digmas. [6] 

teste bicaudal (two-tailed test) O teste da hipotese 
alternativa estatistica diz que a estatistica do teste 
observada nao e igual ao valor esperado sob a hi¬ 
potese nula estatistica. As tabelas estatisticas e os 
programas estatisticos geralmente proveem valores 
criticos e de P associados para os testes bicaudais. 
Comparar com teste unicaudal. [5] 
teste de bondade do ajuste (goodness-of-fit test) Tes¬ 
te estatistico usado para determinar a bondade do 
ajuste. [11] 

teste de randomiza^ao (randomization test) Testes 
estatisticos que recaem no remanejamento dos da¬ 
dos, usando bootstrap , jackknife ou outra estrategia 
de re-amostragem. O remanejamento Simula os 
dados que seriam coletados caso a hipotese nula es¬ 
tatistica fosse verdadeira. Ver tambem metodos de 
Monte Carlo, bootstrap e jackknife. [5] 
teste de razao de verossimilhan^as (likelihood ratio 
test) Um metodo para testar entre diferentes 
hipoteses com base na razao de suas relativas pro- 
babilidades. [11] 

teste unicaudal (one-tailed test) Um teste da hipo¬ 
tese estatistica alternativa de que os valores obser- 
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vados da estatistica teste e maior ou menor (e nao 
ambos) que o valor esperado sob a hipotese nula 
estatistica. Como as tabelas de estatistica normal- 
mente dao o resultado para um teste bicaudal, o 
valor da probabilidade unicaudal pode ser encon- 
trado dividindo a probabilidade bicaudal por dois. 
Comparar com teste bicaudal. [5] 
tolerancia ( tolerance ) Um criterio para decidir 
quando incluir ou nao variaveis ou parametros em 
um procedimento de regressao gradativa. A tole¬ 
rancia reduz a multicolinearidade entre variaveis 
candidatas. [9] 

total da coluna ( column total) A soma marginal dos 
valores de uma coluna em uma tabela de contingen- 
cia. Ver tambem total da linha; total geral. [11] 
total da linha ( row total) A soma marginal dos valo¬ 
res de uma unica linha de uma tabela de contingen- 
cia. Ver tambem total da coluna e total geral. [11] 
total marginal ( marginal total) A soma das frequen¬ 
ces das linhas ou colunas de uma tabela de contin¬ 
gency. [7,11] 

tra^o {trace) A soma dos elementos da diagonal 
principal de uma matriz quadrada. [A] 
transformaqao angular ( angular transformation) 

A fun^ao Y* = arco-seno Vy”> onde o arco-seno(X) 
e a fun^ao que retorna o angulo 0 para o qual o 
seno de 0 = X. Tambem chamada de transforma- 
<^ao do arco-seno ou de transforma^ao do arco-se- 
no da raiz quadrada. [8] 
transformaqao Box-Cox ( Box-Cox transformation) 

Uma familia de transforma^oes de potencias de- 
finida pela formula Y* = (Y x - 1)/^. (para X * 0) e 
Y* = ln( Y) (para X = 0). O valor do X que resulta 
no melhor ajuste a uma distribui^ao normal e 
usado para a transforma<;ao final dos dados. Esse 
valor deve ser obtido por metodos de computa^ao 
intensiva. [8] 

transforma^ao da raiz quadrada {square-root transfor¬ 
mation) A fun^ao Y* = . E usada com mais fre¬ 

quence para dados de contagem, que sao variaveis 
aleatorias de Poisson. [8] 

transformaqao do arco-seno {arcsine transformation) 
Ver transforma^ao angular. [8] 
transformaqao do arco-seno da raiz quadrada {arcsine 
square-root transformation) Ver transforma^ao 
angular. [8] 

transformaqao inversa {reciprocal transformation) 

A fun^ao Y* = 1/Y em geral e usada para dados 
hiperbolicos. [8] 

transforma^ao logaritmica {logarithmic transforma¬ 
tion) A fun^ao Y* = log( Y), onde log e o logarit- 


mo em qualquer base util. Com frequence, e usada 
quando as medias e variances sao correlacionadas 
positivamente. [8, 9] 

transformagao logit {logit transformation) Uma 
transforma^ao algebrica para converter os resul- 
tados de uma regressao logistica, que produz uma 
curva em forma de S, em uma linha reta. [9] 
transforma^ao reversa {back-transformed) A conse¬ 
quence de mudar uma variavel ou uma estimativa 
estatistica de volta as unidades de medida originais. 
A transforma<;ao reversa so e necessaria se as varia¬ 
veis tiverem sido transformadas antes das analises 
estatisticas. Ver tambem transforma^ao. [3,8] 
transposi^ao {transpose) O rearranjo de uma matriz 
tal que as linhas da matriz original sao iguais as 
colunas da nova (matriz transposta) e as colunas 
da matriz original sao iguais as linhas da matriz 
transposta. Simbolicamente, para uma matriz A 
com elementos a-, a matriz transposta A tern os 
elementos a { - = a-. A transposi^ao de matrizes e 
indicada ou pelo sobrescrito T ou pela aspa ('). [ 12] 
tratamento {treatment) Um conjunto de categorias 
de variaveis preditoras usadas em um delineamento 
de analise de variance. Os tratamentos sao equiva- 
lentes a fatores e sao constituidos de niveis. [7] 


uniao {union) Na teoria de conjuntos, sao todos os 
elementos unicos obtidos pela combina^ao de dois 
ou mais conjuntos. Na teoria de probabilidades, e a 
probabilidade de dois eventos independentes ocor- 
rerem. Em ambos os casos, a uniao e escrita com o 
simbolo u. Comparar com intercessao. [ 1 ] 


valor critico {critical value) O valor que um teste es- 
tatistico precisa ter para que sua probabilidade seja 
estatisticamente significativa. Cada teste estatistico 
e relacionado a uma distribui<;ao de probabilidades 
que possui um valor critico para um dado tamanho 
amostral e graus de liberdade. [5] 
valor de P {P-value) Ver valor de probabilidade. [4] 
valor de probabilidade (valor de P) {probability value/ 
P-value) A probabilidade de rejeitar uma hipotese 
nula estatistica verdadeira tambem e chamada de 
probabilidade de erro Tipo I. [4] 
valor esperado {expected value) O valor mais prova- 
vel de uma variavel aleatoria tambem e chamado de 
expectativa de uma variavel aleatoria. [2] 
valores singulares {singular values) Os valores ao 
longo da diagonal de uma matriz quadrada W 
tal que uma matriz A mxn possa ser re-expressa 
como o produto VWU, onde V e uma matriz mxn 
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com a mesma dimensao de A, U e W sao matrizes 
quadradas (dimensoes «x«);eVeU sao matrizes 
com colunas ortonormais. [A] 
varia^ao ( variation ) Incerteza; difereru^a. [1] 
varia^ao dentro de grupos ( variation within groups) 

Ver soma dos quadrados dos reslduos. [ 10] 
varia^ao do erro (error variation) O que permanece 
(nao explicado) por um modelo de regressao ou de 
ANOVA. Tambem chamado de varia^ao residual ou 
de soma dos quadrados dos residuos, ele reflete er- 
ros de medidas e varia<;ao devido a causas que nao 
sao especificadas no modelo estatistico. [9,10] 
varia^ao entre grupos ( variation among groups) Em 
uma analise de variancia, o desvio quadrado das 
medias dos grupos de tratamentos da media geral, 
somados para todos os grupos de tratamentos. 
Tambem e chamada de soma dos quadrados entre 
grupos. [10] 

varia^ao residual ( residual variation) O que e deixa- 
do (nao e explicado) por um modelo de regressao 
ou de ANOVA. Tambem e chamada de varia^ao 
do erro ou de soma dos quadrados dos residuos. 
[9,10] 

variancia ( variance) Uma medida de quao longe os 
valores observados diferem do valor esperado. [2] 
variancia amostral ( sample variance) Uma estimati- 
va sem tendencia da variancia de uma amostragem. 
Igual a soma dos quadrados dividida pelo tamanho 
amostral - 1. [3] 

variavel aleatoria ( random variable) A fun^ao ma- 
tematica que atribui um valor numerico a cada 
resultado experimental. [12] 
variavel aleatoria binomial ( binomial random variable) 
O resultado de um experimento que consiste de 
multiplas tentativas de Bernoulli. [2] 
variavel aleatoria continua ( continuous random varia¬ 
ble) O resultado de um experimento que pode 
assumir qualquer valor quantitativo. Comparar com 
variavel aleatoria discreta. [2] 
variavel aleatoria de Bernoulli ( Bernoulli random 
variable) O resultado de um experimento em 
que ha somente dois resultados possiveis, como 
a presen^a/ausencia; vivo/morto; cara/coroa. Ver 
tambem variavel aleatoria. [2] 
variavel aleatoria de Poisson (Poisson random variable) 
O resultado discreto de um dado experimento con- 
duzido em uma area finita ou em uma quantidade 
de tempo finita. Diferente da variavel aleatoria bi¬ 
nomial, a de Poisson pode assumir qualquer valor 
inteiro. [2] 


variavel aleatoria discreta (discrete random variable) 

O resultado de um experimento que assume apenas 
valores inteiros. Comparar com variavel aleatoria 
continua. [1] 

variavel aleatoria gaussiana (gaussian random varia¬ 
ble) Ver variavel aleatoria normal. [2] 
variavel aleatoria log-normal ( log-normal random 
variable) Uma variavel aleatoria cujo logaritmo 
natural e uma variavel aleatoria normal. [2] 
variavel aleatoria multinomial (multinomial random 
variable) Uma variavel aleatoria que pode assu¬ 
mir multiplos valores. Ela e a extensao multivariada 
de uma variavel aleatoria binomial. [11] 
variavel aleatoria normal (normal random variable) 
Uma variavel aleatoria cuja fun^ao de distribui^ao 
de probabilidades e simetrica em torno da media 
e que pode ser descrita por dois parametros, sua 
media (p) e sua variancia (a 2 ). Tambem chamada 
de variavel aleatoria gaussiana. [2] 
variavel aleatoria normal multivariada (multivariate 
normal random variable) O analogo de uma va¬ 
riavel aleatoria normal (ou gaussiana) para dados 
multivariados. Sua distribui^ao de probabilidades e 
simetrica ao redor de seu vetor medio, e e caracteri- 
zada por um vetor medio n-dimensional e por uma 
matriz de variancia-covariancia nx n. [12] 
variavel aleatoria normal padrao (standard normal 
random variable) Uma fun^ao de distribui^ao de 
probabilidades que produz uma variavel aleatoria 
normal com media = 0 e variancia = 1. Se uma 
variavel X e uma normal padrao, ela e escrita como 
X ~N(0,1). Em geral indicada por Z. [2] 
variavel aleatoria uniforme (uniform random variable) 
Uma variavel aleatoria em que qualquer resultado e 
igualmente provavel. [2] 

variavel categorica (categoric variable) Caracteris- 
ticas que sao classificadas em dois ou mais gru¬ 
pos distintos. Comparar com variavel continua. 
[7,11] 

variavel continua (continuous variable) Caracteristicas 
que sao medidas usando numeros inteiros ou nume- 
ros reais. Comparar com variavel categorica. [7] 
variavel dependente (dependent variable) Em uma 
declara^ao de causa e efeito, a variavel resposta, ou 
o objeto afetado a partir do qual se deseja determi- 
nar a causa. Comparar com variavel independente 
e variavel preditora. [7] 

variavel independente (independent variable) Em 
uma declara^ao de causa e efeito, e a variavel predi¬ 
tora, ou o objeto que e postulado como o causador 
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do efeito observado. Comparar com variavel de- 
pendente e variavel resposta. [7] 
variavel preditora ( predictor variable) O fator hipo- 
tetico de causa. Ver tambem variavel independente 
e comparar com variavel resposta. [7] 
variavel resposta ( response variable) O efeito hipo- 
tetico de um fator causal. Ver tambem variavel de- 
pendente e comparar com variavel preditora. [7] 
verossimilhanga ( likelihood) Uma distribui^ao em- 
pirica que permite quantificar a preferencia entre 
hipoteses. Ela e proporcional a probabilidade de um 
conjunto espedfico de dados, dada uma determi- 
nada hipotese estatistica ou um conjunto de para- 
metros: L(hipotese | dados observados) = cP(dados 


observados | hipotese), mas diferente de uma distri- 
bui^ao de probabilidades, a verossimilhan^a nao e 
restringida ao intervalo entre 0,0 e 1,0. Ela e um dos 
dois termos no numerador do Teorema de Bayes. 
Ver tambem maxima verossimilhan^a. [5] 
vetor coluna ( column vector) Uma matriz com mui- 
tas linhas, mas apenas uma coluna. Comparar com 
vetor linha. [12] 

vetor linha (row vector) Uma matriz com muitas co- 
lunas, mas apenas uma linha. Comparar com vetor 
coluna. [12] 

vetor medio ( mean vector) O vetor com valores mais 
provaveis das variaveis aleatorias multivariadas, ou 
dados multivariados. [12] 
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